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UNMITTELBARE EINFUHRUNG WEIERSTRASSSCHER 
HOMOGENEN KOORDINATEN IN DER HYPERBOLISCHEN 
EBENE AUF GRUND DER HILBERTSCHEN 
ENDENRECHNUNG 


Von 
PAUL SZASZ (Budapest) 
(Vorgelegt von G. Hajos) 


Einleitung 


Unter einer hyperbolischen Ebene soll im folgenden irgendeine Gesamt- 
eit von ,Punkten“ und ,Geraden“* verstanden werden, fiir die auBer den 
benen Axiomgruppen I, II, II] von D. HILBERT,’ noch die nachstehenden 
wei Axiome gelten:? 


IV,. Es seien P,Q zwei verschiedene Punkte in der Ebene und QY 
ine Halbgerade an der einen Seite der’ Geraden PQ. So gibt es stets eine 
talbgerade PX an derselben Seite von PQ, die QY nicht schneidet, wihrend 
ede im {QPX gelegene innere Halbgerade PZ 
lese Halbgerade QY schneidet (Fig. 1). 


IV.. Es gibt eine Gerade g, und einen nicht 
uf ihr liegenden Punkt P, der Ebene derart, dap 
urch Py, zwei verschiedene Geraden gelegt werden 


Gnnen, die g, nicht schneiden. 9 


‘Aus diesem unvollstandigen Axiomensystem 
igt schon’ der von D. HILBERT* bei seiner neuen 


Fig. 1 


1D. Hivsert, Grundlagen der Geometrie, 7. Aufl. (Leipzig und Berlin, 1930), Anhang 
|, S. 160—162. 

2 Von dem modernen, viel allgemeineren Begriff der hyperbolischen Ebene wird hier 
ygesehen. Beziiglich dieses Begriffes verweise ich auf die Arbeit von W. KiincEnBera 
ine Begriindung der hyperbolischen Geometrie, Math. Annalen, 127 (1954), S. 340—356 

3 Paut SzAsz, Uber die Hilbertsche Begriindung der hyperbolischen Geometrie, Acta 
ath. Acad. Sci. Hung., 4 (1953), S. 243—250, insbesondere S. 243, FuBnote. Fiir den Beweis 
she Szhsz PA, A Poincaré-féle félsik és a hiperbolikus sikgeometria kapcsolatardl (unga- 
sch), MTA Mat. és Fiz. Oszt. Kézl., 6 (1956), S. 163—184, insbesondere S. 165, oder aus- 
hrlicher Paut SAsz, A remark on Hilbert’s foundation of the hyperbolic plane geometry, 
‘ta Math. Acad. Sci. Hung., 9 (1958), S. 29—31. 

4 D. Hwsert, Neue Begriindung der Bolyai—Lobatschefskyschen Geometrie, Math, 
analen, 57 (1903), S. 137—150, insbesondere S. 139—140, oder a. a. O.'1, S. 159—177, 


sbesondere S. 162. 


_ Acta Mathematica IX/1—2 


2 P. SZASZ 


Begriindung der hyperbolischen Geometrie der Ebene neben den Axiomgrup- 
pen I, II, III noch als Axiom vorausgesetzte 


Satz. Ist g eine beliebige Gerade und P ein nicht auf ihr gelegener 
Punkt, so bilden die durch P gelegten und g schneidenden Geraden, die inne- 
ren Geraden eines gewissen <(P,,P2). Die Geraden p;, p2, die also g nicht 

mehr schneiden, heiBen die durch P 
gelegten hyperbolischen Paralleten zur 

Geraden g (Fig. 2). 
Nach dem Gesagten bilden die 
Hilbertschen ebenen Axiomgruppen 
8 J, Il, Il zusammen mit den von mir 
gewahliten Axiomen IV, und IV, ein 
Axiomensystem, welches mit dem durch 
D. HILBERT’ zu Grunde gelegten aqui- 
valent ist. Dieses Axiomensystem hat 
den Zweck, ebenso wie das von 
D. HILBERT, die hyperbolische Geometrie der Ebene ausschlieBlich auf Grund 
der ebenen Axiome ohne Anwendung von Stetigkeitsaxiomen zu begriinden. 

D. HILBERT hat in seiner eben zitierten Arbeit die Fernpunkte der Ebene, 
die durch je eine hyperbolische parallele Geradenschar bestimmt werden (Fig. 3), 
Enden genannt. Eine Geradg besitzt infolge des obigen Satzes stets zwei 
Enden (Fig. 4). Nach dem Beweis des grundlegenden Satzes, laut welches 


Bitee 


Fig. 3 Fig. 4 


zu irgend zwei Geraden, die sich weder schneiden, noch einander hyper- 
bolisch parallel sind, stets eine Gerade gibt, welche auf beiden zugleich 
senkrecht steht, konnte D. HILBERT auch die Existenz jener Geraden bewei- 
sen, die zwei vorgeschriebene Enden besitz. Das hat schon zur Folge, daB auf 
eine Gerade von einem nicht zu ihr gehdrenden Ende aus ein bestimmtes 
Lot gefallt werden kann. Von den vorbereitenden Satzen, die D. HILBERT 


5 D. Hivpert, a. a. O. 4, S. 137—140 bzw. S. 160—162. 
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a. O.° seiner sogenannten Endenrechnung vorangeschickt hat, méchte ich 
erbei nur die erwdhnten hervorheben. Diese Endenrechnung, die von ihm 
r die Enden eingefiihrt wurde, werde ich der Vollstandigkeit halber im § 1 
2>sprechen. ; 

Wahrend der von D. HILBERT’ gestreifte Weg zum Aufbau der hyper- 
jlischen Geometrie der Ebene mit Hilfe seiner Endenrechnung durch die 
‘ojektive Geometrie fiihrt, wird in vorliegender Arbeit durch die unmittel- 
ire Einfiihrung gewisser homogenen Koordinaten und selbstsandige Begriin- 
ing der analytischen Geometrie der hyperbolischen Ebene die Grundlage 
r einen vollstdndig elementaren Aufbau geschaffen. Diese Koordinaten wer- 
n bei der Annahme der Stetigkeitsaxiome (statt des Axioms IV,), die das 
yige unvollstandige Axiomensystem zu einem vollstandigen machen, iden- 
sch mit den bekannten WeierstraBschen homogenen Koordinaten, deshalb 
nne ich sie ebenso.” Bei diesem Aufbau der hyperbolischen ebenen Geo- 
etrie habe ich mit der hyperbolischen Trigonometrie nichts zu tun, letztere 
{ vielmehr eine Folge der hier begriindeten analytischen Geometrie der 
rperbolischen Ebene.? Ich mache auch von der euklidischen Geometrie 
inen Gebrauch, daher kann meine Darstellung als ein independenter ele- 
entarer Aufbau der hyperbolischen Geometrie der Ebene gelten.. 


§ 1. Die Hilbertsche Endenrechnung. Die Streckenfunktion E(¢) 
und die aus ihr hergeleiteten Streckenfunktionen 


Die Hilbertsche Endenrechnung ist kurz gefaft und in etwas anderer, 
einem Ziele entsprechender Form, die folgende.”° 

Es sei in der hyperbolischen Ebene ein rechter Winkel mit dem Schei- 
| O vorgelegt, dessen Schenkel als Halbgeraden die Enden £2 bzw. E haben 


6 Siehe a. a. O. 4, § 1, S. 140—145 bzw. S. 164—170. 
‘7D. Husert, a. a. O. 4, § 4, S. 149—150 bzw. S. 175—177. 

8 Bei der Annahme der Stetigkeitsaxiome habe ich die unmittelbare Einfiihrung der 
eierstraBschen homogenen Koordinaten und die selbststandige Begriindung der analyti- 
en Geometrie der hyperbolischen Ebene in einer friiheren Arbeit mutatis mutandis 
rgetan. Siehe Paut SzAsz, Begriindung der analytischen Geometrie der hyperbolischen 
ene mit den klassischen Hilfsmitteln, unabhangig von der Trigonometrie dieser Ebene, 
ta Math. Acad. Sci. Hung., 8 (1957), S. 139—157. 

9 Fiir den Fall der Annahme der Stetigkeitsaxiome siehe Paut SzAsz, Die hyper- 
lische Trigonometrie als Folge der analytischen Geometrie der hyperbolischen Ebene, 
ta Math. Acad. Sci. Hung., 8 (1957), S. 159—161. 

10 Vgl. auch Pau SzAsz, a. a. O. 3, zweites Zitat, § 1, wobei die Hilbertsche Enden- 
hnung als Bogenrechnung beziiglich des Grenzkreises dargestellt wird. Diese Darstellung 
anschaulicher, setzt aber aus der hyperbolischen Elementargeometrie etwas mehr voraus. 
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(Fig. 5). Das Ende §2 (in der Bezeichnung von D. HILBERT das oo) wird 
ausgezeichnet und die Endenrechnung fiir die von $2 verschiedenen Enden 
erklart. Ein solches Ende @ heife positiv, wenn die Geraden e8 und E22 
auf derselben Seite der Geraden O22 liegen, und heife negativ, wenn diese 
Geraden auf verschiedenen Seiten von Of liegen. Wenn wir eine Gerade 
@2 mit dem anderen Ende e an der Geraden O2 spiegeln, so werde das 
von. §2 verschiedene Ende der so entstehenden Geraden mit —e@ bezeichnet. 
Das andere Ende der Geraden O{2 mag mit O bezeichnet werden. 


E 
E 
O~ a+B Op 
7 ie Q 
oO 0 Q 


fess : 8 


Fig. 5 Fig. 6 


D. HILBERT" definiert nun die Summe zweier Enden folgendermaBen: 


ERKLARUNG. Es seien @,8 irgend zwei von §2 verschiedene Enden; 
ferner sei Oa das Spiegelbild des Punktes O an der Geraden e82, und Og 
das Spiegelbild von O an der Geraden 682; die Mitte F der Strecke U.Op 
(im. Falle «= den Punkt O, = Oz selbst) verbinden wir mit dem Ende 2; 
das andere Ende der so konstruierten Geraden F&2 heiBe die Summe der 
beiden Enden « und p und werde mit «+  bezeichnet (Fig. 6). 

_ Die Definition des Produktes zweier Enden wird einfacher als bei 
D. HILBERT,” wenn vorher eine gewisse Streckenfunktion E(t), die den 
Schliissel meiner ganzen Darstellung bildet und die ich tibrigens schon in 
einer friiheren Arbeit'® eingefiihrt habe, definiert wird, wie folgt: 

Die Gerade O82 sei nach 2 gerichtet; bedeute 
(lite a o= E(t) 
das positive Ende derjenigen Geraden, die im Endpunkt A der mit Vorzeichen 
genommenen Strecke OA=t auf O82 senkrecht steht (Fig. 7). Offenbar ent- 

1 D, Hivpert, a. a. O. 4, § 2, S. 145—146 bzw. S. 170—171. 


12D. Hivpert, a. a, O. 4, § 3, S. 147—148 bzw. S. 173. 
13 Paut SzAsz, a. a. O. 8, efstes Zitat, S. 248. 
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spricht ein positives Ende o immer einer bestimmten, mit Vorzeichen genom- 
menen Strecke ¢. 

Mit Hilfe dieser Streckenfunktion (1) kénnen wir nunmehr das Produkt 
zweier Enden folgendermaBen definieren: 


ERKLARUNG. Das Produkt 0,0, der positiven Enden o,—E (f;) und 
I,—= E(t.) heiBe das Ende 


(2) E(t) E(t)=E(4,+h) 
E o=Eft) 7 f e 0103 
S 
: Q 0: ty to i R 
Fig. 7 Fig. 8 


(Fig. 8); wir kommen noch dariiber ein, daB fiir positive Enden a, @ immer 


3) a(—f)=(—a)P=—afs, (—e)(—f)=a8 
und fiir ein von §2 verschiedenes Ende & stets 

‘4) £-0=—0:=0 

qusfalle. 


In der Bezeichnung (1) bedeutet E(O) das Ende E und dieses spielt 
sei der Multiplikation die Rolle der positiven Einheit, da doch nach (2) 


E()E()=—EOEO=—E(h) 
jusfallt. Deshalb sei fiir dieses Ende die Bezeichnung 


5) E(0)=1 
ingefiihrt. Auf Grund von (2) kann diese Formel auch noch in der Gestalt 
5”) _ EME(—-)=—!1 


seschrieben werden. 

Das Ende 0, welches im Sinne von (4) bei der Multiplikation die Rolle 
on Null spielt, verhalt sich auch bei der Addition als Null, da offenbar fiir 
in von £2 verschiedenes Ende 6, stets 


6) E+O=0+E=E 
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und 
(7) Sei(-=§) 0 
besteht. In dieser Endenrechnung gelten nach dem grundlegenden Ergebnis von 
D. HILBERT“ die namlichen Regeln, wie fiir die Rechnung mit gewOhnlichen 
Zahlen. Oder in moderner Ausdrucksweise: die von §2 verschiedenen Enden 
bilden einen kommutativen K6rper. Dieser K6rper hat aber noch die funda- 
mentale Eigenschaft,” daB es zu jedem positiven Ende stets ein positives Ende 
gibt, dessen Quadrat jenem Ende gleich wird. In der Tat ist mit Riicksicht 
auf (2) E(=e(5) . Dem positiven Ende € so entsprechendes Ende mége 
mit )/— bezeichnet und positiver Quadratwurzel von & genannt werden. 

_ Der Korper der von §2 verschiedenen Enden kann noch zu einem ange- 
ordneten Koérper gemacht werden, durch die folgende 


FESTSETZUNG, Es heife « grifer als 8 (@ kleiner als a), in Zeichen 
a> (<a), wenn das Ende «—@6 positiv ausfallt. Man iiberzeugt sich 
leicht, daB fiir positive Enden a,@ im Falle «> die Gerade 822 zwischen 
den Geraden O82 und «82 liegt, und umgekehrt (Fig. 9). Das hat zur Folge, 
dab fiir t>0O stets E(t)>1 ist (Fig. 10) und ganz allgemein 


(8) E(4)> E(G)= tir “Ro, 
E E Ect)>1 


0 Oe A 
Fig. 9 Fig. 10 
Der Kiirze wegen ist es zwackmabig, auBer der Streckenfunktion E(f) 
unter (1), noch die Streckenfunktionen 
(9) C(t) — E(t) tee ‘ S(t) — Se : 
S()_ E®—E(—1) 
Cit) = E(t)+E(—?h) 


§§ 2—3, S.'145—149 bzw. S. 170—174. 
§ 3, S. 148 baw. S. 174. 


T(t) = 


14 D, Hsert, a. a. O. 4, 
15 D. Hivpert, a. a. O, 4, 
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einzufiihren. Wahrend E(¢) das Analogon der Exponentialfunktion ist, sind 
diese letzteren Streckenfunktionen die Analoga der Hyperbelfunktionen. Fiir 
die zwei ersten besteht z. B. die Grundformel 


(10) c(ty— S(t? = 1 

und auch noch 

(11) C(a+6) = C(a)C(b) + S(a)S(), 
sowie 

(12) S(a + 6) = S(a)C(b) + C(a)S(6). 


Auch ihren Verlaufen nach erinnern diese Streckenfunktionen unter (9) 
an die Hyperbelfunktionen, ahnlich wie die Streckenfunktion E(f) an die 
Exponentialfunktion erinnert, z. B. der Ungleichung (8) geniigt. 


§ 2. Die WeierstraBschen homogenen Koordinaten eines Punktes 


Ein Punkt P der Ebene kann durch die folgenden zwei Daten charak- 
terisiert werden. Das eine ist das andere Ende o der Geraden P&2 (Fig. 11). 
Ist aber O, das Spiegelbild von O an der Geraden mit den Enden 


> §2, so ist das andere Ende der 


Geraden O,$2 nach der Definition der 


Summe zweier Enden (§ 1) gleich 


NID 


s+ 5=4 d.h. ist die Gerade 62 


das Spiegelbild von O§2 an der vorher 
erwahnten Geraden, die neben £2 


oO Ba 


das andere Ende + hat. Infolgedes- Fig. 11 


sen liegt das Spiegelbild P’ von P an dieser Geraden mit den Enden 
>: ® auf O&. Nun ist der Punkt P durch die Daten o und OF’ =t, wobei 


letztere auf der nach §2 gerichteten Geraden OQ mit Vorzeichen genommen 
wird, offenbar vollkommen bestimmt. Diese zwei Daten 7, 0 sollen die 
gemischten Koordinaten des Punktes P heifen. Mit Hilfe dieser Koordinaten 


beweise ich den folgenden | 
SaTz. Zwischen den Punkten der hyperbolischen Ebene und den Enden- 


tripeln (X,,X2,X3), fiir welche 
(1) X$—Xy— AG = 1 
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(2) x3 >0 

ist, findet ein eineindeutiges Entsprechen statt. Dieses Entsprechen kann dadurch 
hergestellt werden, dag man einem jeden in gemischten Koordinaten gegebenen 
Punkt (t,o) das Endentripel 


Leen 1 
(3) m= SO) +z 7E(—d), x. = oE(—?), x= Ci) +5 ®E(—P) 
zuordnet. 

Bewels. Fiir das Endentripel (3) erweist sich die Gleichung (1) mit 
Riicksicht auf die Formeln (9) und (10) des §1, sofort als richtig. Und 
mittelst der dritten Gleichung unter (3) fallt das Bestehen von (2) ins Auge, 
da doch C(t)>0 und E(—?t)>0 ausfallen (§ 1, (1), (9)). 

Ich werde jetzt zeigen, dai umgekehrt jedes Endentripel (x,, x2, X;) von 
den Eigenschaften (1) und (2) durch die Zuordnung (3) genau einem Punkt 
(t, 6) entspricht. 

Aus (1) folgt zundachst 

%=14+X+%>%, 
also ist mit Riicksicht auf (2) gewiB x,;>x,, d. h. 
(4) X3—X, > 0. 


Wenn es nun iiberhaupt einen Punkt (¢, 0) gibt, fiir welchen die Gleichungen 
unter (3) bestehen, so muff (§ 1, (9)) 


Xy-+x == CO) Sa Ee 
oder (§ 1, (5*)) 
(5) EO =~ 


gelten. Eine solche.mit Vorzeichen genommene Strecke f gibt es aber genau 
eine, da doch nach (4) die rechte Seite von (5) positiv ausfallt. Aus der 
zweiten Gleichung unter (3) ergibt sich weiter durch Verwendung von (5) 


Xo 
X3;—xX, 


(6) o= 


Das gegebene Endentripel (x,, x:, x3) von den Eigenschaften (1) und (2) kann 
also durch die Zuordnung (3) nur dem durch (5) und (6) bestimmten Punkt 
(ft, 6) entsprechen. 

Durch eine direkte Rechnung verifiziere ich nun, daB es dem in der 
Tat entspricht. 
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(5) und (6) ergeben vor allem (8 1, (5*)) 


x3 


Gra ee 
3 AY 


x} 
ae oS 
und (§ 1, (9)) 


1 1—(x,—x,)* 


1 
: Bt) pe 2 a (%—)| T 2(X3— x) 
bzw. 
rR. ! 1+ (%3—%4)? 
c= 3 [a4 + x) |=4 ees 


Also ist auf Grund von (1) 


Loe _ pe Oem +4 x—M—e— x) 
OS RGU Sy Cara a a Co a 


oe (X3 +21) —(%3;—%) 2. 
2 


xX, 
wahrend 
bee 1+(%—uP+%3  x3—xi + (x3—x,) 
a ae ANY ea eta) gS ee tie 
COts CES 2(x%,—X,) 2(X%,—x) 
X3 + X, + (X3—xX,). 
== 2 = X3. 


Weiter ergibt sich aus (5) und (6) unmittelbar 
oE(—t) =. 


Damit ist das Bestehen von (3) bewiesen. 

Durch die Zuordnung (3) wird demnach zwischen den Punkten (tf, 0) 
der hyperbolischen Ebene und den Endentripeln (x,, x., x3) von den Eigenschaf- 
en (1) und (2) ein eineindeutiges Entsprechen hergestellt, w. z. b. w. 

Aus diesem Grunde sollen die unter (3) definierten Enden x,, x., x, als 
lie. WeierstraBschen homogenen Koordinaten des Punktes (¢, 0) erklart werden. 

Aus (3) ergeben sich fiir t=0,0—0 als die WeierstraBschen homoge- 
ven Koordinaten des Punktes O 


7) 47-0, sey til Xp== le 
In meinen spateren Erérterungen spielt die folgende Eigenschaft der hier 
lefinierten WeierstraBschen homogenen Koordinaten eine entscheidende Rolle: 
fiir die WeierstraBschen homogenen Koordinaten x,, X2,%X3 OzW. X,, Xo, Xs 
weier Punkte ist stets ; 


8) i , X3.X3— XoXo— XX, = 0. 


Sind namlich diese Punkte in gemischten Koordinaten (6 0) bzw. (t, 5), 
so bestehen neben (3) noch 


G %=-SO+ZPH(—D, B-GE1) 4=CH +5 0E(—H) 
und aus diesen Formeln (3), (3) ergeben sich 
4% — CCH +4 8E(HC@ + - @E(—1)C() + 
+ [o'#E(—HE(—), 
eo oEC an ECen 
xX — SOS +4 (HS + 5 PE(—1HSO+ 


+L o'@E(—1E(—). 
Also ist (§ 1, (9), (11)) 


XE — MU = C1) +5 PC E(—DE(—D) + 


a ts @E(— HEC f-.do BOE ee CG te 
+ 5 E(—1) E(—i)(o—0/. 
Da aber hierbei (§ 1, (1), (9)) 
C(tt—t)>0, E(—f>0, E(—t)>0, (e—a=0 


ausfallen, so tritt dadurch die Ungleichung (8) in Evidenz. 


§ 3. Die Gleichung der Geraden. WeierstraBsche homogene 
Linienkoordinaten 


Im folgenden werde ich von den nachstehenden zwei Hilfssdtzen von 
D. HitBert” Gebrauch machen. Diese beziehen sich auf die Endenrechnung, 
die zum angenommenen rechten Winkel §2OE gehort (§ 1). 


HILFSSATZ 1. Sind @ und 8 von {2 verschiedene Enden, und wird die 
Gerade «$2 an der Geraden 882 gespiegelt, so entsteht diejenige Gerade, die 
das Ende 28—a mit 82 verbindet (Fig. 12). 


16 D. Hivpert, a. a. O. 4, § 2, S. 147 bzw. S. 172, weiter § 3, S. 148 bzw. 174. 


UNMITTELBARE EINFUHRUNG WEIERSTRASSSCHER HOMOGENEN KOORDINATEN 1] 


HILFSSATZ 2. Wird durch den Punkt O eine von der Geraden OR 
verschiedene Gerade gelegt, so erfiillen die Enden «a, dieser Geraden die 
Gleichung «8 ——1. Das folgt einfach daraus, daB die Enden einer solchen 
Geraden offenbar a= E(t) und @=—E(—2) sind (Fig. 13). Das Produkt 
dieser Enden ist in der Tat —E(—nhE()=—1 (§ 1, (5*)). 


& 


$2 
o B=-E¢) 


Fig. 12 Fig. 13 


Unter Beniitzung dieser Hilfssatze leite ich nun die Gleichung der 
Geraden her. 

Es sei zundchst eine solche Gerade betrachtet, deren Enden &, 7 von $2 
verschieden sind (Fig. 14). Es sei durch gemischte Koordinaten (§ 2) ein 
beliebiger Punkt P(t, a) dieser Geraden angegeben. Dann geht P mit Riick- 
sicht auf die Definition der gemischten Koordinaten durch die Spiegelung 
= §2 in denjenigen Punkt P’ der Geraden 
O@ iiber, fiir den mit Vorzeichen genommen OP’ =t ausfallt. Dieser Punkt 
P’ geht also durch die Verschiebung langs der Geraden OS2 mit der Strecke 
—t in O iiber. Die urspriingliche Gerade § wird daher durch die Aufein- 
anderfolge von dieser Spiegelung und. 
Verschiebung in eine solche versetzt, 
die durch den punkt O lauft. Die En- 
den & 7 gehen bei der genannten Spie- 
gelung laut des Hilfssatzes 1 in o—&, 
o—n, sodann diese letzteren durch 
jene Verschiebung nach der Definition 
des Produktes (§ 1, (2), (3), (4)) der 
Reihe nach in die Enden E(—?) (o—8), 
E(—t)(o—n) iiber. Da aber die 
Verbindungsgerade dieser Enden iden- Fig. 14 


an der Geraden mit den Enden 
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tisch mit derjenigen ist, in welche §% versetzt wurde, also durch den Punkt O 
geht, so ist nach dem Hilfssatz 2 das Produkt dieser zwei Enden (§ 1, (2)) 
(1) E(—2t)(o—£) (o—n) = —1. 
Demnach geniigen die gemischten Koordinaten t,o eines jeden Punktes der 
betrachteten Geraden & dieser Gleichung (1). Es leuchtet sofort ein, daB 
auch jeder Punkt, durch dessen gemischte Koordinaten f, 0 diese Gleichung 
(1) erfiillt wird, der Geraden 7 angehdrt. (1) ist also die Gleichung dieser 
Geraden in gemischten Koordinaten. Sie geht wegen 
(o—£) (o—n) =§n—E+ 1) 0+ 

durch Multiplikation mit E(t)+-0 in die Gleichung 
(1*) Sn E(—t)—E+n)o£(—t)+o0°E(—t)+E)=0 
iiber. Mit Riicksicht auf die Formeln (3) im vorigen § ist aber (§ 1, (9)) 

Xs—X, = C(—S(f) = E(—b) 


%+X=CH+SAO+e E(—)=—E()+e£(—D), 


und 


wahrend 
X= OE (<— t), 
also kann dieser Gleichung (1*) die Gestalt 


En (x;—x,)— (E+ N)X2+X3+x,=0 
gegeben werden. 


Damit ist gezeigt, daB eine Gerade mit den von §2 verschiedenen Enden 
E, n, in Weierstrafschen homogenen Koordinaten x,,X:,X; durch die Gleichung 


(2) (§4—1) x, +6 +7) %2—(Eq+ 1)%3=0 
charakterisiert werden kann. 

Wird ein von §2 verschiedenes Ende 7 mit £2 verbindet, so lautet die 
Gleichung dieser Verbindungsgeraden in gemischten Koordinaten offenbar 
o—%r=0. Durch Multiplikation mit E(—t)=+-0 wird diese Gleichung infolge 
der Formeln (3) des vorigen § 

X2— 1 (X3—X,) = 0. 


Die Gleichung der Geraden, die das Ende 7 mit Q verbindet, lautet 
also in WeierstraBschen homogenen Koordinaten 


(3) NX, + Xx— Xs = 0. 
Wird die Gerade (2) nach dem Ende & gerichtet, so sollen die Enden 
Enj—l aa fn+1 
4 ring Sd breads pee 
@ rt a ar ar 


als die WeierstraBschen homogenen Linienkoordinaten dieser gerichteten Gera- 
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den erklart werden. Als solche erklare man fiir die nach 2 gerichteten Gera- 
den (3) die Enden 

(5) u=n, v=1, w—7; 

bei Umkehrung des Richtungssinnes sollen die Linienkoordinaten dieser 
Geraden mit —1 multipliziert werden. 


Es besteht fiir die Weierstrapschen homogenen Linienkoordinaten u, v,w 
einer Geraden in jedem Falle 
(6) w+y—w= 1, 
und ihre Gleichung kann in WeierstraBschen homogenen Koordinaten Kae Xe 5 Xs 
in der ,.Normalform“ 
Lt). ux, +vx,—wx, = 0 
geschrieben werden. Umgekehrt ist eine jede Gleichung dieser Art, in welcher 
die Kooeffizienten u,v,w der Forderung (6) geniigen, die Gleichung einer 
serichteten Geraden in ihrer Normalform. 


Davon Nee sar man sich leicht auf Grund der Erklarungen unter (4) 
und (5). 


§ 4. Transformation der WeierstraSschen homogenen 
Linienkoordinaten 


AuBer dem bisher zu Grunde, gelegten rechten Winkel S2OE sei noch 
ein rechter Winkel mit dem Scheitel O’ angenommen werden, dessen Schen- 
kel als Halbgeraden die Enden 2’ bzw. EF’ 
haben (Fig. 15). Wir betrachten diejenige Be- 
wegung bzw. Umwendung der Ebene, durch 
die der rechte Winkel §2’O’E’ in den ur- 
spriinglichen §2OE tibergefiihrt wird. Als Weier- 
straBsche homogene Linienkoordinaten einer 
gerichteten Geraden g in Bezug auf das ,Ko- 
ordinatensystem“ §2’O'E’ sollen die Linien- g 
koordinaten u,v’, w’ (§ 3) derjenigen Geraden 
g’ verstanden werden, in die g bei der betrach- o 
teten Bewegung bzw. Umwendung iibergeht. 

Wir sehen zu, wie sich uw’,v’, w’ durch die 
urspriinglichen Linienkoordinaten ua’, v’, w’ von 
g ausdriicken lassen. 

Die Beantwortung dieser Frage kann auf 

die bekannte Tatsache gegriindet werden, dab Fig. 15 


E 


PCx;xi,3) 


gtu,v,w3 
Pls, XH) 
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bei einer Bewegung bzw. Umwendung der Ebene ein jedes Ende & in 


a hs 
OF eer ee, 
iibergeht, wobei @, §,7,d von § unabhangig sind und 
(2) ad—fy= + 1 


ausfallt, je nachdem eine Bewegung bzw. Umwendung vorliegt.” (Im Falle 
y=+-0 geht das Ende — Sin £2, und £2 in das Ende = ber.) 


Sind die Enden der gerichteten Geraden g von $2, sowie von £2’ ver- 
schieden, und sind diese Enden & 7 so bezeichnet, daB g nach dem Ende & 
gerichtet ist, so sind im Sinne von (1) die entsprechenden Enden von g’ der 
Reihe nach 

: , @b+8 ,  @n+B6 
Uy e740? T—ynte" 
Auf Grund dieser Formeln (1*) ergeben sich mit Riicksicht auf (2) fiir die 
Linienkoordinaten u’, v’, w’ der Geraden g’ in Bezug auf das urspriingliche 
System (§ 3, (4)) die Enden 


itt we ea _(e—y')én + (e8— 7) E+n) +e —F 


ae + €—n) 

fob et arta Gy ad) Cen) aed 
Siegal + (E—n) 

w PHI _@+Y)Ent (Cty) EP DEALS 
ad £€—7) 


Es ist aber, wie sofort ersichtlich (§ 3, (4)), durch die urspriinglichen Linien- 
koordinaten u, v,w der Geraden g ausgedriickt 


2 __ w+u 2v 
w—u’? ?! w—y’ Salat wainis 


und durch Einsetzen in die obigen Formeln erhalt man nach u, v, w geordnet 
e—v— B24 ff ait i ° ee 
‘é eh u+(aB—78)v +S —PEE—F |, 


se + 


(3) v= + {(ey— 8d) u+(6y+ ad) v+ (ay + 8d) w}, 


i ae a+ 7—P—e 
4 2 


ct(abtydyo4 SALE EO yf 


17 Vgl. H. Liesmann, Uber die Begriindung der hyperbolischen Geometrie, Math. Anna- 
len, 59 (1904), S. 110—128, insbesondere S, 118. Fiir den Beweis siehe Pau SzAsz, a. a. O. 3, 
S. 246—247, sowie den Anhang. 
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Nerden hierbei in der /-ten Gleichung die Koeffizienten von u,v, w der Reihe 

ach mit Qj1, Qj2,a;3 bezeichnet (j= 1, 2,3), so lauten diese Formeln 

Be u’ = A, U+ay.v+a,3 W, 
) U! = Ag), + Agy V+ Ans W, 
W’ = Ag, U+ Ago V+ Ass W. 


Diese Formeln (3) bzw. (3*) sind auch dann giiltig, wenn die Enden 
on g nicht beide von £2 und £2’ verschieden sind. Davon iiberzeugt man 
ich leicht, in jedem méglichen Falle. 

Fir die Koeffizienten auf der rechten Seite von (3*) gelten die Glei- 
hungen 

Qn + @n—ay = 1, 
4) Qin + Qj — A, = 1, 
— Ais— O33 + O33 = 1 


nd ouch noch 

Ay, Aye + Ay, Ag2— As) Aza == O, 
Qy2 Ay3 + Arg Aoz3 — Azy Azz = O, 
Qy3 Ay, + Ay3 Ay — Ags Az, = 0. 


5) 


Jiese ergeben sich auf Grund von (2) durch einfache Rechnung mit Riick- 
icht auf die unter (3) angeschriebenen Ausdriicke der Koeffizienten aj. 


Die aus den Koeffizienten a; gebildete Determinante ist 


ae EO eae 2 en lO) ine 89 
a ap—vyo res Bs z 

5) Laer ay—fd = By +ad ay + fo mat 
2 ass O 2 2 241 2 
eS tens FL nee PAE ON 


fie man sich davon auf Grund der ersten Gleichung unter (4) und mit 
iicksicht auf (2) durch die Entwicklung 


D=a,D,+a,D.+a@yD; 


ach den Elementen der ersten Kolonne leicht tiberzeugen kann. 
Zusammenfassend kénnen wir also iiber die Transformation der Weier- 
raBschen homogenen Linienkoordinaten folgendes aussagen: 


Sind die WeierstraBschen homogenen Linienkoordinaten einer gerichteten 
teraden in der durch den rechten Winkel §2OE definierten Endenrechnung 
er Reihe nach u, v, w, so ergeben sich ihre Linienkoordinaten u’, v’, w’, beziig- 
ch eines neuen Koordinatensystems §2'O'E’ aus den Formelin unter (3°), wobei 
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die Koeffizienten aj, von g unabhdngig sind und den Gleichungen unter (4) 
und (5) geniigen, ferner die Determinante dieser Transformation 


ayn Ay A 
(6°) D=|Qx Q A23 |= 1 
Q3, Azo As3 
ausfalit. 


Aus (4) und (5) folgt bekanntlich,* daB fiir die Koeffizienten aj, auch 
die Gleichungen 
} Qi + Qip—Qi3 = 1. 


(7) a3, + dj. — a3, = 1, 
— G5, — Aa + Ais = 1 
und 
Qy1. xy + Ay2Ax9 — 013 Qo3 = O, 
(8) Any As, + Ay M32 — Azz 33 = O, 
Qs, Ay + A32Qy2— O33 013 = O 


bestehen. Diese Gleichungen k6énnen iibrigens ahnlich wie die unter (4) und. 
(5) durch direkte Rechnung verifiziert werden. 
Aus (3) folgen schon durch eine leichte Uberlegung die Formeln. 


=-jre Acta, amy a 8d)v' + ie fe ae 


v= + {(@8—yd)u’ iin: —(a8+yd)w’}, 
=" f° — ey at eal 2 wf. 


’ 


-u '—(ay+ 8d)v’ + — 


Das ‘beantel mit Riicksicht auf die unter (3) BREED: Ausdriicke 
der Koeffizienten a, in (3°), folgendes: 


Die urspriinglichen WeierstraBschen homogenen Linienkoordinaten u, v, w 
sind durch die auf das neue Koordinatensystem $2’ O'€’ bezogenen Linien- 
koordinaten u’,v’, w’ ausgedriickt 


( u=ay,u' + ayv’ —as Ww’, 
V = Ayu’ + Ayu’ —AgW’, 
W = —Qj3U’ —Axyv’ + dggW’, 
wobei die Koeffizienten aj, mit denen unter (3°) identisch ausfallen. 


(9) 


18 Vgl. z.B. G. Kowatewski, Einfiihrung in die Determinantentheorie einschlieBlich 
der unendlichen und der Fredholmschen Determinanten (Leipzig, 1909), S. 161. 
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§5. Transformation der WeierstraBschen homogenen 
Punktkoordinaten. Der Abstand zweier Punkte 


Ahnlich wie am Anfang des vorigen § die Linienkoordinaten, definiere 
ich die Weierstraischen homogenen Punktkoordinaten in Bezug auf ein neues 
Koordinatensystem folgendermafen: 


Als WeierstraBsche homogene Koordinaten eines Punktes P in Bezug auf das 
»Koordinatensystem* 2’O'E’ sollen die Koordinaten x;, x;, x;(§ 2) desjenigen 
Punktes P’ verstanden werden, in den P bei derjenigen Bewegung bzw. 
Umwendung der Ebene iibergeht, durch die der rechte Winkel 9’O’'E’ in den 
urspriinglichen 22OE tibergefiihrt. wird. 

Wir sehen zu, wie sich die urspriinglichen Koordinaten durch die neuen 
ausdriicken lassen und umgekehrt. 

Es sei zu diesem Zwecke durch den Punkt P eine gerichtete Gerade g 
yelegt, deren urspriingliche WeierstraBsche homogene Linienkoordinaten (§ 3) 
Jer Reihe nach u,v,w, und die auf das neue System bezogenen u’, v’, w’ sind. 
Durch diejenige Bewegung oder Umwendung, welche den rechten Winkel 
§’O’F’ in 2QOE tiberfiihrt, gehen die Gerade g und der Punkt Pin g’ bzw. 
P’ iiber, die die urspriinglichen Linien- bzw. Punktkoordinaten u’, x’, w’ bzw. 
X;, X5,xX3 haben. Da aber die Gerade g’ durch den Punkt P’ hindurchgeht, so 
st (§ 3, (7)) 

1) u’xit+vx,—w’ x; =0. 
Diese Gleichung nimmt durch Anwendung der Transformationsformeln der 
WeierstraBschen homogenen Linienkoordinaten (§ 4, (3°)) die Gestalt 


Ay, Xj + Any Xp — Ag, Xz) U + (Ayo Xj + An X3— gy Xy) V— (— yg Xj — Aug Xz + Asg Xz) W = O 
in. Wenn der Kiirze halber die Bezeichnung 
Yr = Oy Xq + Ay X— 151. X3, 


2) V2 = Ay2X1 + AyeXz—AgaX3, 
Yu = — AygX{ — AygXz + Ayy Xz 

ingeftihrt wird, so geht diese Gleichung (1) in 

a”) WU + Yov—yY,w =O 


iber. Aus (2) folgt mit Riicksicht-auf die Gleichungen (7) und (8) des 
origen §4 
—Yy— i = XP XE +S, 


—V—YVi =1, 
a doch x/, xj, x, WeierstraBsche homogene Koordinaten sind. Demnach sind 
ntweder 3, ¥.,¥; oder —y,,—J2,—ys die WeierstraBschen homogenen 


Iso ist (§ 2, (1)) 


2 Acta Mathematica 1X/1—2 
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Koordinaten eines Punktes Q in der durch den rechten Winkel S2OE defi- 
nierten Endenrechnung. Dieser Punkt Q liegt aber infolge (1°) auf der Gera- 
den g, und zwar bei beliebiger Wahl der letzteren, die durch den Punkt P 
gelegt wird, deshalb fallt Q mit P zusammen. Die Enden }j,, yo, 3; oder 
—Ji,;—Jo, —Js Sind also mit x,,%2,X3 der Reihe nach identisch, und es — 
bestehen daher mit Riicksicht auf (2) die Formeln 

Xy == €(Ay X} + A, X2— Ags Xs), 
(3) Xp = &(A1oX} + AnXs— AsoX3), 

X3 = &(—O3X1 — AogX3 + As3X3), 
wobei ¢— + 1 ausfallt. Jedem Punkt P entspricht ein solches Vorzeichen e, 
es ist aber noch fraglich, ob dies fiir jeden Punkt dasselbe ist. 

Ich zeige, daB es unter (3) fiir jeden Punkt P dasselbe «—-+ 1 gilt, 
je nachdem die Koordinatensysteme S2OE und $2’O’E’ gleichsinnig oder 
ungleichsinnig ausfallen. 

Fiir den Beweis seien X,, X,,X; die WeierstraBschen homogenen Koor- 
dinaten eines von P verschiedenen Punktes P. Dann gelten neben (3) die 
entsprechenden Gleichungen 

Xi = € (AX; + AX; — Ay Xs), 

Xp = E(QyyXj + AgoX2 — Ago Xs), 

X; = e(— 3X4 — Aye Xo + Ag3.X3) 
und auf Grund der Gleichungen (7) und (8) im vorigen §4 ergibt sich 
hieraus 
(4) XgX3— Xo Xq— XX, — #& (XG Xy — XyXg—X, X}). 
Da aber hierbei der auf der linken Seite, sowie auf der rechten in Klammern 
stehende Ausdruck positiv ausfallt (§ 2, (8)), so ist e««>0, es bedeuten also 
é und é in den beiden Punkten gewif dasselbe Vorzeichen. Wird nun (3) 
speziell auf den Punkt O’ angewandt, dessen Koordinaten in Bezug auf das 
neue System §2’O’E’ der Reihe nach x; =0, x; =0,x;— 1 sind (§ 2, (7)), so 
erhalt man aus der dritten Gleichung x,—éa,3, d. h. mit Riicksicht auf die 
dritte Gleichung unter (3) im vorigen § 


@e $2 
x= + @Sechahfae dy 
wobei das voreichen + oder — gilt, je nachdem das System 2’ O’E’ durch 
eine Bewegung bzw. Umwendung in QOE tibergefiihrt wird, oder mit ande- 
ren Worten die beiden Koordinatensysteme gleichsinnig oder ungleichsinnig — 
ausfallen. Das hat wegen x,;>0O (§ 2, (2)) zur Folge, daB diesen zwei calen 
entsprechend auch e— + 1 ist, wie behauptet wurde. 
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Wir haben somit folgendes Ergebnis gewonnen: 


Sind xX,,%2,X; die WeierstraBschen homogenen Koordinaten eines Punktes 
Pin der durch den rechten Winkel 82OE definierten Endenrechnung und 
“i, Xi, x3 die Koordinaten desselben beziiglich eines neuen Koordinatensystems 
2’ O’E’, so bestehen die Transformationsformeln 


X= 1 (Any + Ay Xy— Ag Xs), 

Xp == 1 (y.Xj + Ayo X3— AyoX3), 

Xg = 1 (—A43 Xj — Ay Xz + AsgXz), 

wobei die Koeffizienten aj, von P unabhdngig, ndmlich mit den obigen (§ 4, (3*)) 

dentisch sind, und das Zeichen +- oder — giiltig ist, je nachdem das neue Koor- 

linatensystem mit dem urspriinglichen gleichsinnig oder ungleichsinnig ausfallt. 
Aus (3°) kann schon auf Grund der Formeln (9) des vorigen § durch 

sine leichte Uberlegung gefolgert werden, daB die neuen WeierstraBschen 

homogenen Koordinaten x;, Xj, x; durch die urspriinglichen ausgedriickt 


| X= (Ay Hy + yy Xp + Ais Xs), 


3*) 


5) X= + (Aq Xi + Gm X2+ es X2), 

X3 = = (Agr X1 + Asy Xz + Ass Xp) 

sind, wobei das Zeichen + oder — zu nehmen ist, je nachdem die beiden 
Koordinatensysteme gleichen oder entgegengesetzten Drehungssinn haben. Es’ 
Kann noch mit Riicksicht auf die Formel (6") des vorigen § zusatzlich hin- 
zugefiigt werden, daB die Determinante der EY 

Transformation (5) dem giiltigen Vorzeichen © 

ontsprechend A= + 1 ist. 

Die Formel (4) hat wegen e=—¢=— + 1 
zur Folge, daB der Ausdruck x3 X;—X.X2—%4%X 
segen Koordinatentransformation invariant 
st. Wird das neue Koordinatensystem £2’ O'E’ 
30 gewahlt, daB O’ mit dem Punkt P zusam- 
nenfallt und P auf der Halbgeraden O’ $2’ 
iegt (Fig. 16), so sind die neuen Koordina- 
en dieser Punkte..x,;—0, x,—0, x=! 
‘S 2, (7)) bzw. x= S(d), x,—=0, xx —C(d) 
§ 2, 3)), also der fragliche Ausdruck x; X;— x; x,;—x,x,== C(d@). Wir kénnen 
somit wegen der Invarianz dieses Ausdruckes folgendes feststellen: 

Der Abstand d der Punkte P und P von den WeierstraBschen homogenen 


Koordinaten X,,X2,X3 OzwW. X,,X2,X3 ist durch die Formel 
6) C (d) =X Xs— Xa Xa— MH 


bestimmt. 


Fig. 16 


ae 
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E Mit. Hilfe dieser Formel kann die ein- 
fache geometrische Bedeutung der Koordinate 
x, gleich entdeckt werden. Wird ndmlich 
neben dem Punkt P(x,, X2,X3) als zweiter 
Punkt P—O gewéahlit (Fig. 17), dessen 
Koordinaten xX,, = 0, X%—0O,x,;=1 sind 
(§ 2, (7)), so lehrt die Formel (6) folgendes: 
Die dritte Koordinate des Punktes P ist 

Q mit dem Abstand OP=d ausgedriickt 


Fig. 17 (7) xX3—= C(d). 


P (X,XzXz) 


§6. Der Abstand eines Punktes von einer Geraden 


Es seien x,,X%,X; die WeierstraBschen homogenen Koordinaten eines 
Punktes P und u,v,w die Linienkoordinaten einer gerichteten Geraden g. 
Hat ein neues Koordinatensystem §2’O’E’ denselben Drehungssinn wie das 
urspriingliche System S2OE£, so ist nach den Formeln der Transformation 
der Linien- bzw. Punktkoordinaten (§ 4, (3*); § 5, (5)) 

UX + V'X—W' X3 = (An U + Aye + Aig) (AX + AiaXo + AisXs) + 
+ (Aq U + Amv + AogW) (Aa, X1 + Ara Xg + Gog X3) — 
— (G51 4 + Agad + AggW) (Agi X + Age Xs + Asp X3). 

Es besteht also auf Grund der Gleichungen (4) und (5) des § 4 die Formel 
(1) u’ Xx, v' X— wW' x3 = UX, + VX— WX. 

Der Ausdruck ux,+vx,—wx, ist demnach gegen Koordinatentransformation 
bei Beibehaltung des Drehungssinnes inva- ’ 

riant. Dieser Ausdruck hat eine einfache geo- E e 
metrische Bedeutung. Um sie zu bestimmen, 
werde das neue Koordinatensystem $2’ O’E’ 
so gewahlt, wie es an der Figur 18 zu sehen 
ist. Wir nehmen zunachst an, daB P auf der 
positiven Seite der Geraden g liegt, und es 
sei t der Abstand dieses Punktes von g. 
Bei derjenigen Bewegung, durch die der 
rechte Winkel §2’O’E’ in 82OE iibergefiihrt 
wird, geht der Punkt P in P’—O und die 
Gerade gin g’ tiber, die auf O®@ senkrecht 
steht. Letztere ist mit OE gleichgerichtet und hat von O den Abstand t>0 
(Fig. 19). Die Enden &, 7 dieser Geraden g’ (wobei & in die positive Rich- 


Fig. 18 
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tung gefallen sei) sind (§ 1,(1))§= E(t) und 7 —E(t), also hat g defini- 
tionsgemaB (§ 4) in Bezug auf das neue System 2’O’E’ die Linienkoordi- 
naten (§ 3, (4)) 


pte rast ee aa ene (Pie 
Ue cny Ve. ,, (ia: 7 2E@ 
E()—E(—2t) 
=— 5 —— S(t) 


(§ 1, (5°), (9)), wahrend P die neuen Koordinaten (§5) x,—=0, xj —0, xj 
(§ 2,(7)) aufweist. Demnach ist auf Grund von (1) der fragliche Ausdruck 
ux, + vX,— wx, = S(t). Liegt P auf der ne- 
gativen Seite von g, d.h. auf der positiven 
Seite der entgegengesetzt gerichteten Geraden 
von den Linienkoordinaten —wu, —v, —w, 
so ist nach dieser Formel 


E 


— UX, —vX.+ Wx, = S(f). 


ZusammengefaBt kénnen wir dieses Ergebnis 
so ausdriicken: 


Sind x,,X2,X; die WeierstraBschen ho- 
mogenen Koordinaten eines Punktes P und 
u,v, Ww die Linienkoordinaten einer gerichte- 
ten Geraden g, und wird der Abstand t dieses n=~-E(t) 
Punktes von dieser Geraden positiv oder 
negativ genommen, je nachdem P auf der 
positiven oder negativen Seite von g liegt, so besteht die Formel 
(2) S(t) = ux, + vx,— wx. 

E Diese Formel (2) ist geeignet, die ein- 
fache geometrische Bedeutung der zwei ersten 
Koordinaten x,, x. zu entdecken: Da namlich 
dasEnde E in der Endenrechnung §=E(0)=1 
ist (§ 1,(5)) und folglich das andere Ende 
der Geraden OE als 1=—1 ausfallt, so 
sind die Linienkoordinaten dieser nach E 
gerichteten Geraden der Reihe nach —1, 0, 0 
>Q (§3,(4)). Wird also der Abstand des Punk - 

tes P(x,,X2,Xs) von der Geraden OE mit 

—a bezeichnet, so ist nach (2) —x1=S(—a), 
j.h. x,—S(a). Da die Gerade O82 das andere Ende. 0 hat, also die 
Linienkoordinaten dieser nach 82 gerichteten Geraden der Reihe nach 0, 1,0 


Fig. 19 


oF 
Fig. 20 
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sind (§3,(5)), so besteht fiir den Abstand 6 des Punktes P von O82 im 
Sinne von (2) x, S(6). 

Mit Riicksicht auf die Formel (7) des vorigen § kénnen wir also tuber 
die geometrische Bedeutung der Weierstraischen homogenen Koordinaten 
eines Punktes zusammenfassend folgendes feststellen: 


Wird der Abstand eines Punktes von der Geraden OE mit a, von der 
Geraden O2 mit 6, und vom Punkt O mit d bezeichnet, und zwar (Fig. 20) 
aan der rechten Seite von OE, 6 an der oberen Seite von O82 positiv, und 
an der anderen negativ genommen, so sind die im §2 unter (3) definierten 
WeierstraBschen homogenen Koordinaten dieses Punktes 


(3) X,==,5 (0), .xus3 SAP eee) 


§ 7. Die geometrische Bedeutung des Ausdruckes 
U,U,+v,%2.—W,W, in Bezug auf zwei Geraden 


Ich betrachte nun zwei voneinander verschiedene gerichtete Geraden 
£1, 2, die in der durch den rechten Winkel §2O€E definierten Endenrechnung 
die WeierstraBschen homogenen Linienkoordinaten w,,v,,W, DZW. Us, vo, We 
haben (§ 3). Auf Grund der Formein unter (3°) im §4 und mit Riicksicht 


e €,7Eta) 


1),=-E(-a) 


Fig. 21 Fig. 22 


auf die Gleichungen (4) und (5) in demselben § ist der Ausdruck u, Uy + 
+ vy %— W, W2 gegen Koordinatentransformation invariant. Es sind beziiglich 
der geometrischen Bedeutung dieses Ausdruckes drei Falle zu unterscheiden. 


I° Fall. Die Geraden g,, g, schneiden einander. 
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Das neue Koordinatensystem 2’O’E’ werde so gewdhlt, wie es die 
Figur 21 zeigt. Von dem in die positive Richtung fallende Ende von 2 werde 
auf g, das Lot gefallt, und der Fufpunkt F desselben habe von O’ den mit 
Vorzeichen genommenen Abstand a. Bei derjenigen Bewegung bzw. Umwen- 
dung, durch die der rechte Winkel 2’O’E’ in S2OE iibergefiihrt wird, gehen 
die gerichteten Geraden g,, g, der Reihe nach in £2iy22, der Punkt F in F’ 
iiber, wobei mit Vorzeichen genommen OF’ —a ausfallt (Fig. 22). Die Enden 
von g; sind §2 und 7,0, und zwar fallt 2 in die positive Richtung von 
gi. Sind &, die Enden von g;, wobei & in die positive Richtung gefallen 
sei, so ist (§ 1, (1)) ’ 

S&.—=E(a), ™m—=— E(—a). 
Also hat g. in Bezug auf das neue System £2’O’E’ definitionsgemaB (§ 4) 
die Linienkoordinaten (§ 3, (4); § 1, (9)) 


a tine be’ =) Sted) eae 
rai DEG AC a) 
wahrend-die von g, (§ 3, (5)) 


u,=0, vu=—1, wi=—0 


T(a), . Wa=--*, 


sind. Es folgt deshalb 
Uy Uy + v4 %2— Wi Ww, = T(a), 
und wir haben somit wegen der Invarianz des fraglichen Ausdrucks folgen- 
des Resultat gewonnen: 
Fiir einander schneidende gerichtete Geraden g,, 2, hat man 


(1) u, Uy + Uy V2— W, Wo, 7 T(a), 
wobei a den vom Schnittpunkt der beiden Geraden gerechneten Abstand des 
Fufpunktes desjenigen Lotes bedeutet, welches E E! 


von dem in die positive Richtung fallenden 
Ende der Geraden g, auf g, gefallt wird 
(Fig. 21). 

2° Fall. Die Geraden g,, g. haben ein 
gemeinsames Lot und sind gleichgerichtet. 

Es sei a>O der zwischen g, und g» 
fallende Teil des gemeinsamen Lotes, und 
das neue System £2’O’E’ werde so gewahlit, 
wie es die Figur 23 andeutet. Wird der rechte 
Winkel 2’O’E’ durch eine Bewegung bzw. ; mit 
Umwendung in S2OE tibergefiihrt, so gehen gi, 2 der Reihe nach in die 
gerichteten Geraden 21, g2 tiber, die das gemeinsame Lot O22 haben, dessen 
zwischen diesen Geraden fallender Teil a>0O ist (Fig. 24), und zwar fallt 2: 


Of U,.V,,W, ) 
GC, Vs. 


Fig, 23 
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mit der Geraden OE iiberein, nach dem Ende E oder (§ 1, (5)) &:=1 gerich- 
tet. Das andere Ende von gi ist 7,—-—1, wahrend g; die entsprechenden 
Enden & = E(a), y.—=—E(a) hat (§1, (1)). Die neuen Linienkoordinaten 


von £;,g2 sind mithin (§ 3, (4)) 
u=—1, 4=—0, wi=—0 


Ent ss Es Eta) bzw. : 
if DE ayes Hoa «se eee 
2 2E(a) ’ 2 ’ 2 ’ 
also ist in diesem Falle (§ 1, (5*), (9)) 
, , ieee 4 , , E a : 1 
Uy U3, + 0, 09— W; Wy = oRa == C(a). 


Infolge der Invarianz des fraglichen Ausdruckes 
kann demnach jetzt folgendes festgestellt werden: 


Haben die Geraden g,, g, ein gemeinsa- 
mes Lot und sind sie gleichgerichtet, so ist 


(2) UU, + V,v2—W, W, = C(a), 
1,=1 n,=-E(a) wobei a den Abstand der Schnittpunkte dieser 
Fig. 24 Geraden mit ihrem gemeinsamen Lot bedeutet 
(Fige23). 


3° Fall. Die Geraden g,, g, sind hyperbolisch parallel und gleichgerichtet. 
Es kann offenbar angenommen werden, daB die beiden Geraden nach 
dem gemeinsamen Ende gerichtet sind. In diesem Falle werde das neue 
Koordinatensystem §2’O’E’ so gewahlt, wie es an der Figur 25 zu sehen ist, 


E 


€,°E,=E( t) 


t 
9,(U,4,,0,) 


G,(Upy,.We J 82" 
Q n=-ECt) nz Ect) 


eres Fig. 26 
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und es sei das von O’ auf gy, gefilltes Lot als positive Strecke mit ¢ bezeich- 
net. Bei derjenigen Bewegung bzw. Umwendung, durch die der rechte 
Winkel §2’O’E’ in SOE iibergefiihrt wird, gehen die gerichteten Geraden 
£1, , der Reihe nach in gi, g) tiber (Fig. 26), mit dem in die positive Rich- 
tung fallenden Ende &,—§&,— E(t). Das andere Ende von g’ ist 7, = SEE (ii), 


wahrend g; das andere Ende 7,—— E(t) hat. Demzufolge sind die neuen 
Linienkoordinaten dieser Geraden (§ 3, (4); § 1, (9)) 

, —2 , , 

= Ch et Sa w, =0 


E®+E(—-)  ~=C() 
bzw. (§ 1, (5*)) 
,  —E(ty—1 


SEG OM: HHO We, 


woraus sich 

Uy U3 + vv; — WW, = 1 
ergibt. Wegen der Invarianz dieses Ausdruckes sind wir somit in diesem 
dritten Falle zum folgenden Resultat gekommen: 

Es besteht fiir hyperbolisch parallele und gleichgerichtete Geraden g,, 2» 
(Fig. 25) die Gleichung 
(3) | Ul, Uy + V,V.— WW, = 1. 

Aus den gewonnenen Formeln (1), (2) und (3) kann mit Riicksicht auf 
den Verlauf der Streckenfunktionen C(f) und 7(t) (§1) folgendes gefolgert 
werden: 

Die in WeierstraBschen homogenen Linienkoordinaten gegebenen verschie- 
denen Geraden g,(U;, 1,,W:), £2(Us, V2, Ws) 

1. schneiden einander dann und nur dann, wenn 

| ty Uo + v2— WW, | < 1 
ausfdalt, insbesondere stehen sie nur dann aufeinander senkrecht, falls 
Uy Uy + vy Vg — WW, = 0 
rst: 
2. haben ein gemeinsames Lot dann und nur dann, wenn 
| Uy Wy + vy 2—W,We| > 1 
ausfallt ; 
3. sind hyperbolisch parallel dann und nur dann, falls die Gleichung 
. UL, Uy + V1 Vg— W Wy = al 
besteht. - 


* 


Durch diese Erérterungen der §§ 2—7 habe ich im Besitze der Hilbert- 
schen Endenrechnung, die analytische Geometrie der hyperbolischen Ebene 
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selbststindig begriindet. Ich meine damit fiir einen vollstandig elementaren und 
independenten Aufbau der hyperbolischen Geometrie der Ebene, die Grund- 
lage geschaffen zu haben. 

Es ist in der Tat nicht schwer, auf Grund der obigen Darlegungen 
auch die homogenen Koordinaten von Fernpunkten (d. h. Enden) und von 
idealen Punkten einzufiihren, sowie den Begriff der idealen Geraden bzw. 
Randgeraden analytisch zu erklaren. Die Identitat der hyperbolischen ebenen 
Geometrie mit dem bekannten Klein—Hilbertschen Kreismodell,” wohlver- 
standen unabhangig von der Stetigkeit, ist sodann eine Folge dieser analy- 
tischen Geometrie.” 


Anhang 


Darstellung der Bewegungen bzw. Umwendungen der hyperbolischen 
Ebene mit Hilfe der Hilbertschen Endenrechnung 


Die Bewegungen bzw. Umwendungen der hyperbolischen Ebene sind, auf 
die Enden & bezogen, analytisch durch die linearen Transformationen 


; E 
(1) y= STG (@d—#y>0) 
bzw. 
(2) yo (e8—87<0) 
dargestellt. 


Fiir diesen oben benutzten Satz (§ 4), der dem Wesen nach von 
H. LIEBMANN™ herriihrt, habe ich schon friiher einen einfachen Beweis mit- 
geteilt’ In den folgenden Zeilen gebe ich der Vollstandigkeit halber diesen 
Beweis mit einer wesentlichen Modifikation wieder. Diese neue Beweisanord- 
nung scheint mir anschaulicher zu sein. 


1° Vgl. F. Kiem, Uber die sogenannte Nicht-Euklidische Geometrie, Math. Annalen, 
4 (1871), S. 583—625, insbesondere S: 620—621, oder Gesammelte mathematische Abhand- 
Sa ie / (Berlin, 1921), S. 254—305, insbesondere S. 300—301; ferner D. HILsert, a.a. O. 1, 
S. 38. 

0 Fiir den Beweis der Indentitit der hyperbolischen ebenen Geometrie mit der 
Poincaréschen Halbebene, ebenfalls unabhaingig von der Stetigkeit, siehe B. KEréKJARTO. 
Nouvelle méthode d’édifier la géométrie plane de Bolyai et de Lobatchefski, Commentari. 


Math. Helv., 13 (1940), S. 11—48. Dieser Beweis erfordert eine viel kompliziertere Be- 
trachtungsweise. 


21H. LIEBMANN, a. a. QO. 17, 
2 Siehe 17, 
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Da die Transformationen 


—" 


P=E+4,.8=—z, Pau (u>0) 


der Reihe nach eine Drehung um den Fernpunkt 2, die Halbdrehung um 
den Punkt O, eine Verschiebung langs der Geraden O& bedeuten,” so stellt 
die Transformation (1) auf Grund der Umformung (im Falle y +0) 


ee eee eee bY — 


eine Bewegung der hyperbolischen Ebene dar pers leuchtet unmittelbar ein, 
falls y—0O ist). 

Umgekehrt kann eine jede Bewegung der hyperbolischen Ebene, durch 
eine derartige Transformation dargestellt werden, wie es die folgende Uber- 
legung zeigt. 

Die Bewegung ist durch die Angabe 
derjenigen Halbgeraden O’m, die in O22 iiber- 
gefiihrt wird (Fig. 27), vollkommen bestimmt. 
Sie la4Bt sich nun im Falle m= aus den 
folgenden vier Bewegungen zusammensetzen: 

1° Drehung um den Fernpunkt 2, bei 
der die Gerade m2 in O82 iibergefiihrt wird. 
Dabei soll die Halbgerade O’w in O,0 iiber- 
gehen. Der homologe Punkt von O, auf der 
Geraden O2 sei mit Oj bezeichnet. (Dieser 
Punkt wird durch die Forderung ~00,O0f= 
=<0010; bestimmt.) 

2° Verschiebung langs der Geraden O22, 
bei der Oj in den Punkt O iibergeht. Dabei werde O,0 in die Halbgerade 
O20 iibergefiihrt. Da Of der pee. Punkt von O, war, so ist jetzt O der 
von QO. 

3° Halbdrehung um den Punkt O. Dabei soll O,0 in die Halbgerade 
O;§2 iibergehen. Da O und O, homologe Punkte waren, so sind O und O; 
ebenfalls homologe Punkte. 

4° Drehung um den Fernpunkt £2, bei der die Gerade O;82 in O82 
iibergeht. Da O und O,; homologe Punkte waren, so wird dabei die Halb- 
gerade O;,82 in O82 iibergefiihrt. 


Fig. 27 


23D, Hipert, a. a. O. 4, § 4. 
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Wie man sieht, wird durch die Aufeinanderfolge dieser vier Bewegun- 
gen, die Halbgerade O’w in O82 tibergehen. Die angenommene Bewegung 
ist also in der Tat die Zusammensetzung dieser Bewegungen 1°—4°. 

Bei der Bewegung 1° geht ein von £2 verschiedenes Ende & in E=E+4 


; 1 
liber, bei 2° wird § in B= = >0), sodann § durch 3° in &—=— = 


iibergefiihrt, endlich wird & bei der Bewegung 4° in 5,—& + tibergehen, 
wobei 4, u, ” von & unabhangig sind. Folglich ist die betrachtete Bewegung 
durch eine Transformation 

aes u == vE+(vé—un) re) 

Ses Eo es eee eo) 
dargestellt, die die Form (1) hat. 

Im Falle w == ist die Bewegung offenbar die Zusammensetzung einer 

Drehung um den Fernpunkt £2 und einer Verschiebung langs der Geraden 


O, also durch eine Transformation 
f= us+Ay—us+uA (u > 0) 

darstellbar, die ebenfalls von der Form (1) ist. ; 

Die Transformation &’ ——E& stellt definitionsgemaB (§ 1) die Spiegelung 
an der Geraden Of dar, also bedeuten die Transformationen (2) mit Riick- 
sicht auf die Bedeutung der Transformationen (1), die Umwendungen der 
hyperbolischen Ebene. 

Damit ist der Beweis des obigen Satzes iiber die Transformationen (1) 
und (2) beendet. , 

Diese Beweisanordnung hat auch den Vorteil, daB solcherart der nach- 
stehende Satz von B KEREKJARTO™ zugleich mitbewiesen ist. 


Jede Bewegung der hyperbolischen Ebene kann aus den folgenden zusam- 
mengesetzt werden: 


a) Halbdrehung um einen gegebenen Punkt O; 


b) Verschiebung lings einer Geraden O22, wobei 2 ein gegebener Fern- 
punkt ist ; 


c) Drehung um den Fernpunkt &. 


Wahrend der urspriingliche Beweis von B. KEREKJARTO fiinf solche 
Bewegungen verwendet, bin ich im obigen mit vier ausgekommen. 


(Eingegangen am 30. Juli 1957.) 


°4B. KEREKJARTO, a. a. O. 20, § 2, Théoréme 11. 


A REMARK ON HILBERT’S FOUNDATION 
OF THE HYPERBOLIC PLANE GEOMETRY 


By 
PAUL SZASZ (Budapest) 
(Presented by G. Hajos) 


D. HILBERT’ showed that the hyperbolic plane geometry may be built 
up also exclusively based on the axioms of the plane and without the use 
of axioms of continuity. The system of axioms laid down by him for this 
purpose may be even somewhat more reduced. Namely, as I have already 
alluded to at another place,? beside HILBERT’s groups of axioms I, II, Ill on 
incidence, order, and congruence in the plane, the following two axioms 
are sufficient : 


AxI0M IV,. Let P,Q be two different points in the plane, and QY a half- 
line on one side of the straight line PQ, then there exists always a half-line 
PX on the same side of PQ, that does not intersect QY, while every half- 
line PZ lying in the XQPX cuts the half-line QY (Fig. 1). 


P, A, 


Fig. 1 Fig. 2 


Axiom IV,. There exists in the plane a straight line s, anda point P; 
outside it through which two different straight lines can be drawn not inter- 


secting So. 


=D: Huscers Neue Begriindung. der Bolyai—Lobatschefskyschen Geometrie, Math. 
Annalen, 57 (1903), pp. 137-150; or Grundlagen der Geometrie, 7. ed. (Leipzig und Ber- 
lin, 1930), Anhang Ul, pp. 159—177. 

2 Paut Szdsz, Uber die Hilbertsche Begriindung der hyperbolischen Geometrie, Acta 
Math. Acad. Sci. Hung., 4 (1953), pp. 243—250, in particular p. 243, footnote 2. 
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From these axioms we can conclude indeed on the axiom by which 
the Euclidean axiom of parallels was substituted by HILBERT if maintaining 
the groups I, II, III of axioms. Namely, by help of these groups L, ie 
and of my Axioms IV,, IV. we can prove the following 

THEOREM. /f s is any straight line and P any point outside it, then the 
straight lines drawn through P and intersecting s form the interior of a cer- 
tain. <X(P;, P2) (Fig. 2). | 

For the proof we use the following 

Lemma. /f the point R moves along the half-line QY, then xQRP—0O 
for ORs oo (Fig. 3). 


P. x 


Zz 
Fig. 3 


This lemma is due to JANOS Botyal.’ We prove it by Axiom IV,. 

Let PX be the half-line mentioned in Axiom IV,. Let us be given an 
arbitrarily small angle «. We draw the half-line PZ in 2QPX in such a 
manner (Fig. 3) that << ZPX<s. According to Axiom IV,, PZ cuts QY ina 
point 7. If TS=7P, then aTSP=aATPS. Since 1a TPS< xZPX<z, 
we have <7SP<s. Moreover, if TR> TS then, as well known, x TRP< 
<<TSP. Therefore we obtain 47RP<e if TR>TS. Thus 1QRP<e 
holds if QR is large enough, i.e. xQRP-—+0O for QR--+ c and the 
lemma is proved. 


PROOF OF THE THEOREM. By reason of Axiom IV, there exist two 
straight lines /,m through P, not crossing s, (Fig. 4). Let d denote the 
supplement of that angle »—-<(i,m) which contains the straight lines 
through P, and crossing s, (Fig. 4). Owing to our lemma, we can obviously 
choose the points A,B on s, in such a way that 


JIPAB+APBA<<d. 


8 Jonannes Boryai, Appendix. Scientiam spatii absolute veram exhibens etc. (Maros- 
vasarhely, 1832), § 1. 
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it follows that the sum of the angles in the triangle ABP, is less than two 
‘ight angles since <AP,B<w and the angles «,06 form two right angles. 
From this it follows, as well known, that in any triangle the sum of the 
angles is less than two right angles.‘ Relying on this fact it results at once 


Fig. 4 


Fig. 5 


(Fig.5) that in the case of every straight line s and every point P outside 
it there exist two straight lines through P which do not cross s. Hence, by 
Axiom IV,, the theorem follows immediately. 


(Received 30 September 1957) 


4 A very elegant proof was given by K. Frapr, Der Saccheri—Legendresche Satz etc., 
Zeitschrift fiir Mathematischen und Naturwissenschaftlichen Unterricht, 56 (1925), p. 345. 


ZUR AXIOMATIK DER ZAHLEN 


Von 
HANFRIED LENZ (Miinchen) 
(Vorgelegt von G. Hajés) 


Es ist iiblich, die elementare Arithmetik ausgehend von den Peanoschen 
Axiomen' zu entwickeln und anschlieBend die ganzen, rationalen und reellen 
Zahien mit ihren Rechengesetzen einzufiihren. Hier sollen die Peanoschen 
Axiome etwas abgeschwacht werden. Man erhdlt so gemeinsame Axiome fiir 
das System der natiirlichen Zahlen, der ganzen Zahlen und fiir endliche 
zyklische Gruppen, und kann ausgehend davon in natiirlicher Weise die 
Addition und Multiplikation in diesen Bereichen gemeinsam einfiihren. 


§ 1. Axiomatische Definition der Zahlensysteme 


Man kann die Peanoschen Axiome wie folgt fassen: 

Die natiirlichen Zahlen bilden eine Menge N mit einer umkehrbaren 
Abbildung zc (der Nachfolgerfunktion) in sich von folgender Eigenschaft: 

Es gibt in N ein Element 0€ N", so daB aus O€ USN und UCU 
stets U=N folgt. 

Dieses Axiomensystem schwdchen wir wie folgt ab: 

DEFINITION 1. Ein Zahlensystem ist eine Menge S mit einer Abbildung 
zt in sich von den folgenden Eigenschaften: 
(1) (I) <t ist umkehrbar, d.h. aus x" =y" folgt x=y 
(Il) Es gibt ein Element O€S, so daB aus O€ UcS und U“ = UNS" 
stets U=S folgt (Induktionsaxiom). 


Eine Teilmenge UCS soll also mit S zusammenfallen, sobald sie die 
Zahl O und mit jedem Element x den Nachfolger und, falls einer existiert, 
einen Vorgdnger von x enthalt. Es ist wohlbekannt, da die natiirlichen 
Zahlen, die ganzen Zahlen, sowie die Elemente einer zyklischen Gruppe die- 


1 Vgl. etwa Asser oder Lanpav. Namenangaben beziehen sich auf die Literaturan- 


gaben am Schlu8. 
2Das Bild des Elements x bzw. der Menge X sei mit x" bzw. X" bezeichnet. 


Natiirlich ist es Formsache, ob man die natiirlichen Zahlen mit der 0 oder mit der 1 
beginnen 14Bt. 


3 Acta Mathematica IX/1—2 


34 H. LENZ 


sem Induktionsaxiom geniigen. Wir wollen zeigen, dai es — abgesehen von 
Isomorphie — keine anderen Zahlensysteme gibt, die den Axiomen (1) (I) 


und (Il) geniigen. 
Wir zeigen zundchst, daf die Sonderstellung der Zahl O nur scheinbar ist. 


HILFSSATz 1. Ist U eine nichtleere Teilmenge von S mit der Eigenschaft 
"= US", so ist U=S. 

Bewels.’ V sei die Menge aller x €S mit der Eigenschaft: Fiir beliebi- 
ges U mit x € U, U"=UNS" ist U=S. Nach (1) (Il) ist O€ V. 

Nun sei y€ V und y"€ U, U" =UNS", also y"€ UN S"=U". Nach 
(1) (1) folgt daraus y€ U. Wegen y€ V folgt (nach der Definition von V) 
U=S. Also ist y7€V, wieder nach der Definition von V. 

Ferner sei y€ V und y=2z"; U sei eine z enthaltende Teilmenge von 
S mit U°=UnS", also U"SU, 2" =y€U. Wegen y€ V muB U=S sein. 
Weil das fiir beliebige nach obiger Vorschrift gewahlte Teilmengen UCS 
gilt, mu zé€V sein. 

V enthalt also mit jedem Element y den Nachfolger y", sowie den Vor- 
ganger, falls er existiert. Also ist V’—=VnS". Nach dem Induktionsaxiom 
folet V—S, w. z. b. w. 


HILFSsATz 2. Hat die Zahl 0 keinen Vorgdnger, so hat jede andere Zahl 
einen Vorgdnger. 


BEwEls (ohne Verwendung von (1) (I)). Es sei 0€ S”. D sei der Durch- 
schnitt aller Mengen UC S mit den Eigenschaften 0€ U, U"CU. D hat selbst 
diese Eigenschaften. D enthalt nach Definition aufer O kein Element a ohne 
Vorganger in D; denn mit D hatte auch die Differenzmenge U—D\{a} 
die Eigenschaften 0 € U, U"CU, im Widerspruch zu der Annahme, daB D 
der Durchschnitt aller derartigen Mengen sein sollte. Daher ist D" = D\{0}. 
Es folgt Dn S"“©& D\ {0} =D". Andererseits ist offenbar D’<© Dn S", also 
D" = DS", nach dem Induktionsaxiom also D = S, S*—= S\{0}, w. z. b. w. 

Gleichzeitig haben wir das Induktionsprinzip in der klassischen Form 
abgeleitet, namlich 


Satz 1. Ein System S, das durch (1) (ll) erkldrt ist, und in dem die Zahl 
O keinen Vorgdnger hat, geniigt dem Peanoschen Induktionsaxiem. Gilt auch: 
(1) (1), so gelten alle Peanoschen Axiome. 


Weil man nach Hilfssatz 1 die Zahl 0 in den Axiomen durch jede 
andere Zahl ersetzen kann, folgt (wenn (1) (1) vorausgesetzt ist) 


HILFSSATZ 3. Es gibt in S héchstens ein Element ohne Vorgdnger. 


3 Vgl. Loewy, S. 6, wo eine dhnliche Betrachtung angestellt wird. 
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Spater wird gezeigt werden, da® dieser Hilfssatz ohne Verwendung des 
ixioms (1) (I) bewiesen werden kann. 


SATZ 2. Ein nach (1)(1) und (1) (Il) erkldrtes Zahlensystem S mit 
CS geniigt den Peanoschen Axiomen. Die Rolle des Nullelements iiber- 
immt dabei das einzige Element der Menge S\S". 


DEFINITION 2. Ein System natiirlicher Zahlen ist ein Zahlensystem S 
ut der Eigenschaft S"—S. Eine natiirliche Zahl ist ein Element eines Sy- 
lems natiirlicher Zahlen. Wenn nichts anderes gesagt wird, bedeute dabei 0 
tets das einzige Element von S\.S". (Das ist keine Folgerung aus den 
ixiomen, sondern eine willkiirliche, aber zweckmaBige Festsetzung, die nach 
lilfssatz 1 berechtigt ist.) 

Wir behandeln nun den Fall 
2) Sn S 
ind unterscheiden zwei Unterfalle : 
2a) Jede nichtleere Untermenge USS mit der Eigenschaft U"SU ist mit S 

identisch. 

Jann nennen wir S ein zyklisches Zahlensystem. 

2b) Es gibt eine nichtleere Untermenge VCS mit V“C V; nach Hilfssatz 1 

also V"c V (sonst ware doch V=S). 

Jann nennen wir S ein System ganzer Zahlen. 

Natiirlich haben derartige Definitionen nur einen Sinn, wenn sie wider- 
pruchsfrei sind. Am einfachsten ist das im Fall (2a). Dann liefert schon die 
Aenge {0} ein Beispiel. Die Existenz eines Systems natiirlicher Zahlen schlieBt 
jan nach DEDEKIND aus dem Glauben an die Existenz einer Menge, die sich 
mkehrbar in eine echte Teilmenge abbilden laBt. Unter Annahme dieses 
ilaubenssatzes zeigen wir nun, dap es Systeme ganzer Zahlen gibt. 

Es seien + und — die beiden Elemente der Menge {+,—}, und N 
in System natiirlicher Zahlen mit der Nachfolgerfunktion 71,. Wir betrachten 
ie Produktmenge N x {+, —} = S und fiihren in ihr eine Nachfolgerfunktion 
r ein durch die Festsetzungen 


PGF) =O" +), (x,—)" = (=) fir x=+0, (0, —)"=(0,+). 

Man iiberzeugt sich miihelos, daB S die Bedingungen (1), (2) und (2b) 
rfiillt. 

Umgekehrt lapt sich jedes System ganzer Zahlen S mit der Nachfolger- 
unktion zc in zwei Systeme natiirlicher Zahlen N, N- mit den Nachfolger- 
unktionen z¢ bzw. st! zerlegen. 

Es sei etwa V die in (2b) angegebene Menge. Nach Hilfssatz 1 kann 
1 den Axiomen die Zahl O durch jede andere ersetzt werden; daher ist es 


3* 
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keine Beschrankung der Allgemeinheit, O€ V, O€ V" anzunehmen. Wir setzen 
1.0" . Weiter bedeute N bzw. N- den Durchschnitt aller Mengen UCS 
mit den Eigenschaften 


(3) 0€U, U"SU 
bzw. = 
(4) 1.€ U; U" GU. 


Es ist NCV, also NCS. Weiter ist 1.€N, also 1.-€S\.N. Wegen 
0€V"DN’" ist 
(5) |S all ww oe 

Ferner enthalt S\.N mit jedem x auch x" , daher ist N-GS\N oder 
NnN.=@, also O€N., 1-€N", 


(6) NS ONS 

Weil N und N_ den Bedingungen (1) geniigen, sind sie Zahlensysteme, 
wegen (5) und (6) also Systeme natiirlicher Zahlen. Ihre Vereinigung enthalt 
O und mit jedem x auch x7 und x", fallt also mit S zusammen, w. z. b. w. 


§ 2. Die Definition durch Induktion 


Fiir die Zulassigkeit der Definition durch Induktion ist ein auf KALMAR 
zuriickgehender Beweis iiblich.* Unsere axiomatische Darstellung gestattet 
einen anderen einfachen Beweis.° 


SATZ 3. Es sei N ein System natiirlicher Zahlen mit der Nachfolger- 
funktion zc und B eine beliebige nichtleere Menge. y sei eine beiebige Abbil- 
dung der Produktmenge NB in die Menge B. Dann gibt es zu jedem b€ B 
genau eine Abbildung a von N in B mit den Eigenschaften 


(7) O° = 6, (0°) = (x, x) 
BEweEls. Eine Abbildung @ von NB in sich sei erklart durch 
(8) (x, =O Ge 


D sei der Durchschnitt aller Teilmengen UO NX B mit den Eigenschafte 
(0,b)€U, UFCU. 
Offenbar gentigt D hinsichtlich des Nullelements (0,6) und der Nach- 


folgerfunktion § der Forderung (1)(II); also gilt Hilfssatz 2 des vorigen 
Paragraphen. (0, 6) hat in Nx B, also erst recht in D keinen Vorganger. 


‘Vgl. z. B. Kneser, S. 82. Uber Verallgemeinerungen des Satzes vgl. van DER WaERDEN 
(§ 3), Lorenzen. 


5Inhaltlich bringt der vorliegende Paragraph nichts Neues. 
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Nach Hilfssatz 2 hat daher jedes andere Paar (x, y) € D einen Vorganger in D. 
Insbesondere kann (0,c) mit c+ 6 nicht in D liegen. 

X sei die Menge aller x € N, fiir die genau ein Paar (x,y) mit ye B 
in D liegt. Es ist O€ X. Nun sei etwa x € X, (x, y)€D, (x, z)¢ED firz+y. 
Dann ist wegen D°<D sicher (x", (x, y)”) € D. Ein anderes Paar (x", ft) kann 
nicht in D liegen; denn es kénnte in D keinen von (x, y) verschiedenen 
Vorganger haben. Wenn es gar keinen hat, so liegt es nach Hilfssatz 2 nicht 
in D; ist aber (x, y) der Vorganger, so ist t—(x, y)’. Daher ist x"€ X; nach 
Satz 1 ist also X=N. 

Es gibt also zu jedem x€N genau ein Paar (x, y)€ D. Die Abbildung 
@: x—»+y mit (x,y) €D erfiillt die Bedingungen (7). Ist @’ eine zweite Abbil- 
dung, die diesen Bedingungen geniigt, so sei Y die Menge aller x mit 
x* =x. Y enthalt O und mit jedem x auch x". Daher ist Y—N. Damit ist 
Satz 3 bewiesen. 

Satz 4. Je zwei Systeme natiirlicher Zahlen sind isomorph, d.h. sind 
N, N’ Systeme natiirlicher Zahlen mit den Nachfolgerfunktionen 2 bwz. x’, 
so gibt es eine umkehrbare Abbildung « von N auf N’ mit den Eigenschaften 
(9) nie replete rian. 

Bewels. DaB die zweite Eigenschaft (9) aus der ersten folgt, ergibt 
sich durch beiderseitige Multiplikation mit @'. 

Mit den vorherigen Bezeichnungen sei 60’ (Null des Systems JN’), 
(x, y)”=y" gesetzt. Dann wird (x, y)’ =(x",y"). Weil die Voraussetzungen 
in N und N’ ganz symmetrisch sind, gibt es nicht nur zu jedem x € N, son- 
dern auch zu jedem y€ N’ genau ein Paar (x,y)€D. Also bildet @ das 
System N umkehrbar auf N’ ab. Die Bedingung ez’= se ist nichts ande- 
res als die zweite Zeile von (7), w. z. b. w. 

Aus der am Schluf des §1 gezeigten Zerlegung jedes Systems ganzer 
Zahlen in zwei Systeme natiirlicher Zahlen folgt nun sofort: 

Je zwei Systeme ganzer Zahlen sind isomorph. 


§ 3. Folgerungen aus dem Induktionsaxiom allein 


Wir setzen nun voraus, daf ein System S gegeben sei, das nur dem 
Axiom (1) (II) zu geniigen braucht. Sein Nullelement heife 0’, seine Nach- 
folgerfunktion 7’. Nach Satz 3 gibt es eine Abbildung @ des Systems N der 
natiirlichen Zahlen in S mit den Eigenschaften 

OF =<0;, 
xm —— xen” fiir x€N, oder kurz 
(11) A=. 


(10) 
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« ist also ein Homomorphismus von N in S. Weiter sei w eine Abbildun; 
von S" in S mit der Eiegpsches 
(12) xiey *firvalles xe Sy 
d.h. wz’ bildet S" identisch ab. Die Abbildung » besteht einfach darin 
daB zu jedem Element von S" ein Vorgainger ausgewahlt wird. Wir verwen 
den also in diesem Paragraphen das Auswahlprinzip. Jetzt sind zwei Fall 
zu unterscheiden. 

Fall 1. (0) existiert fiir alle natiirlichen Zahlen n€ N. 

Fall 2. Es gibt eine natiirliche Zahl m, so dab (o')" genau fiir n<n 


existiert. 

Wir setzen nun die Abbildung @ auf negative Zahlen als Argument 
fort durch die Festsetzung 
[ «yy fa y alle n¢€N im Fall 1, 
(13) aD) ee (O) “T | O<n<m im Fall 2. 
Dann gilt, wie man mit Hilfe von Gleichung (12) leicht sieht, die Gleichuns 
xr == x im Fall 1 fiir alle ganzen Zahlen x, im Fall 2 fiir alle ganzet 
Zahlen x >—™m. @ ist also ein Homomorphismus der Menge M aller ganzet 
Zahlen bzw. aller Zahlen >—m in S. Im Fall 2 ist M isomorph zu N. Wi 
setzen nun 

<< im Fall 1 (fiir alle ganzen Zahlen x), 

| (ee metal a im Fall 2 (fiir natiirliche Zahlen x). 

Dann ist @ ein Homomorphismus des Systems Z der ganzen Zahlet 
bzw. des Systems N der natiirlichen Zahlen in das System S mit den Eigen 
schaften 


(14) O’'€ Z® bzw. O' ENS, 
(15) xP — Ors fir alle wex eZee oe N 
BEHAUPTUNG.  bildet Z bzw. N auf S ab. 


Bewels. Wir setzen U=Z* bzw. N®. Aus x€U, etwa x= yy? folg 
XT = yr’ = yh CU, also 


(16) U" CUR Sie 


_ Ferner sei x€ Un S". Im Fall 1 sei wieder xy? gesetzt. y hat in z 
einen Vorganger, etwa z; dann ist x—yé— 27? — 2’ dh. x hat einet 
Vorganger in U, oder es ist 


(17) US cate. 
Im Fall 2 hat (—m-+1)*—0" keinen Vorganger in S. Ist dagegen n—1 € N 


xb — 
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so hat n* =(n—1) den Vorgiinger (n—1)’ in U. Also ist 
U=U" u {0°} oder ie U\ {0}. 

Es folgt Un S" ©Un [S\{0°}] = U\ {0°} = U", also wieder (17). Nach (16) 
und (17) ist Un S" =U", nach dem eee Te also U=S, w. z. b. w. 

Wenn die Funktion @ umkehrbar ist, so ist S zu Z bzw. zu N iso- 
morph. Wir nehmen also jetzt an, @ sei nicht umkehrbar. Ist a® — 6? fiir zwei 
Zahlen a,b, so ist auch a"™* —b6"8, d.h. die Menge M aller Zahlen x, fiir die 
eine Zahl yx mit x*—y? existiert, enthalt mit jedem x auch x". Ent- 
weder ist also 

Fall a) M=Z bzw. M=N, oder’ 

Fall 6) es gibt in der Komplementarmenge M eine groBte Zahl p. 

Wir untersuchen zunachst Falla). Es sei k die kleinste Zahl > 0, so daB 
fiir irgendeine Zahl x (aus Z bzw. N, je nachdem ob Fall 1 oder 2 vorliegt) 


(18) (x + k)? = x8 
ist. Dann ist auch fiir alle y>x 
(18’) (yk =e 


Wir zeigen, da (18) sogar fiir alle x gilt. Andernfalls sei z die gréBte Zahl 
mit (z+)? + 28. Unter den positiven Zahlen n, fiir die (z+n)®’—2z? ist 
(solche gibt es wegen M=Z bzw. M=N und (18’)), gibt es eine kleinste, 
etwa g. Nach unserer Annahme iiber k ist g > k. Dannist aber (z+ q—k)*? = 
= (z+q)’=2z? im Widerspruch zur Minimaleigenschaft der Zahl g. Die Glei- 
chung (18) muf also fiir alle x€Z bzw. N gelten. S enthdlt genau die k 
Elemente 04, 1°,...,(kK—1)*. Es ist S* —S. (a’)* ist die Identitat. S erweist 
sich in diesem Fall als zyklisches Zahlensystem. Man denke etwa an die Rest- 
klassen nach der Zahl & in der elementaren Arithmetik der ganzen oder der 
natiirlichen Zahlen. Die Nachfolgerfunktion z’ ist umkehrbar; denn aus 
x” —y" wiirde, wenn wir x =a’, y— OD? setzen, folgen 
ae" == Pn’, grb — "8, also a™==b" (modk), a=b (modk) 

‘ und daher xy. 

Fall b) p sei die gréBte Zahl aus M. Alle Zahlen <p gehdren gleich- 
falls zu M. Es gibt eine kleinste Zahl r>O mit (p+1+7)?=(p+1). Fir 
alle y>p ist, wie Induktion zeigt, (y-t+r)’—y?. Wir nehmen an, es gebe 
eine kleinste Zahl z€ M, fiir die ein positives s<r mit (z-+s°)—2? existiert. 
Dann ist, wie Induktion zeigt, 

(z+r—s—1) =(z+r—1) = (2-1)? 


6 Wir verwenden hier die Addition und die Ordnung der natiirlichen bzw. ganzen 
Zahlen. 
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im Widerspruch zur Minimaleigenschaft vom z. Also ist M ein zyklisches 
Zahlensystem aus r Elementen und M eine vorgeschaltete, zu einem Abschnitt 
entweder von Z (d. h. zu einer riickwarts angeordneten natiirlichen Zahlenreihe) 
oder von N (d. h. zu einer endlichen Folge) isomorphe Menge. 

Die ftinf Falle, die nach dieser Untersuchung fiir Systeme S, die dem 
Induktionsaxiom (1) (II) geniigen, méglich sind, werden in der Figur veran- 
schaulicht. 


Oo 7 (1) (1), nicht (2) 
(natiirliche Zahlen) 


ies Me ES Mr a yi 
(ganze Zahlen) 


(1) (I), (2), (2a) 
(zyklisches Zahlensystem) 


1 
Ga) 
Ong 
ae) Nicht (1) (1), nicht (2) 
gent 20%. f 


Nicht (1) (1), (2) 


Fig. 1. Systeme, in denen das Induktionsaxiom (1) (II) gilt 


In den zuletzt behandelten Fallen, in denen also die Abbildung ¢ nicht 
umkehrbar ist, ohne daf S ein zyklisches Zahlensystem ware, nehmen wir 
an, es sei 

x"=y" fiir x,yeS. (x+y), 
etwa x =a’, y= bf, a"® — "8, Das ist im Fall a< 6 nur mdglich fiir a" € M, 
b"€ M, also a"=6" (mod r), a=b6 (mod r). Im Fall a€ M ist xy; nur 
im FallagM, 6€M, alsoa=p, b=p-+r ist x+y. 

Im Fall a) ist also ’ umkehrbar, wahrend es im Fall b) genau ein 
Paar (x,y) mit y+ x gibt, fiir das x” — y" wird. 
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Ab jetzt setzen wir wieder stets das Axiom (1) (I) voraus, das man 
nach dem Ergebnis dieses Paragraphen auch ersetzen kénnte durch: Gibt es 
in S zwei Elemente mit demselben Nachfolger, so gibt es in S noch ein drittes 
Element, das mit einem anderen denselben Nachfolger hat. 


Daraus folgt namlich ein Widerspruch, sobald man die Voraussetzung 
dieser Forderung als zutreffend annimmt; also die Umkehrbarkeit von 27’. 


§ 4. Homomorphismen von Zahlensystemen 


Unter einem Homomorphismus @ eines Zahlensystems S mit der Nach- 
folgerfunktion zr in ein Zahlensystem S’ mit der Nachfolgerfunktion z’ ver- 
stehen wir eine Abbildung von S in S’ mit der Eigenschaft (9) 


tMa=an. 


Ein umkehrbarer Homomorphismus ist ein Isomorphismus, was sich 
durch Links- und Rechtsmultiplikation mit a! ergibt. 


HILFSSATZ 4. Sind @ und 8 zwei Homomorphismen eines Zahlensystems 
S in ein Zahlensystem S', und ist a*=—<a? fiir ein a€S, so fiir alle a€S, 
d. h. es ist a=. 


Bewels. Die Menge U der Zahlen x€S mit der Eigenschaft x* — x? 
enthalt nach Voraussetzung die Zahl a und mit jeder Zahl x wegen 
ae —— xan’ —— xr’ — "6 auch die Zahl x". Ist x€ U Nachfolger einer Zahl y, 
so ist 

yo. = y"™ eee yh = Rell 
wegen der Umkehrbarkeit der Funktion z’ also y € U. Daher ist U"—UnS", 
also U=S, w. z. b. w. 


HiLFssatz 5. O sei im Fall S"<S Element von S\S", andernfalls ein 
beliebiges Element von S (diese Annahme ist nach Hilfssatz 1 zuldssig). 
Dann gibt es zu jedem a€S genau einen Homomorphismus @, von S in sich 
mit der Eigenschaft 0°* =a. 


Bewels. DaB es héchstens einen solchen Homomorphismus gibt, folgt 
aus Hilfssatz 4. Zu zeigen ist noch, daB es mindestens einen gibt. Usei die 
Menge der a€5S, fiir die ein Homomorphismus ¢, mit 0” =a’  existiert. 
Offenbar ist O€ U, weil die Identitat ein Homomorphismus ist. Aus x¢€U 
folgt nun 0%—x, 0%"=x". Ferner ist (a. )=(sa@,)1—=(@,2) 1, d. Hh. 
@,7 ist ein Homomorphismus und x” € U. Im Fall SCS" sind wir also nach 
Satz 1 fertig. 
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Nun sei S"==S. Dann existiert 2’, und aus x€ U, x= y", 10,=@, 
folgt a, 7 =m 'az, (ists says ferner 20 (@, 7071) =(a.7") a, d.h. Ge 
ist ein Homomorphismus. Es folgt ye U, U= OU = Spwe2rttee 


DEFINITION DER ADDITION. /n einem Zahlensystem bedeute a, den Hom 
morphismus, der O in y tiberftihrt. Dann erklaren wir 


(19) x+y—=x% fir alle x€S. 
Aus dem assoziativen Gesetz fiir Homomorphismen folgt leicht d 
assoziative Gesetz der Addition. Es ist namlich 
x=0", ptz=y==(0%) =0%"? —0%*?, 
x+ (V+ A= (OPP =O, 
(x+y) + z= (0%) =— 0° 


Im Fall S"—S sind nach Hilfssatz 5 alle Homomorphismen umkeh 
bar, und ihre Umkehrabbildungen sind wieder Homomorphismen. Zu je zw 
Elementen a, 6 gibt es namlich eindeutig bestimmte Homomorphismen a. 
mit a’==-b, 6° =a. @f \aft also a fest und ist daher die Identitat. Im Fi 


S"—S verstehen wir unter —a das Element oe Offenbar ist a+ (—a): 


= —ata=0. D.h. 
Ein Zahlensystem S mit S"=S_ bildet hinsichtlich der Addition ei 
Gruppe. 


Das kommutative Gesetz der Addition beweist man leicht durch Indu 
tion. Das bleibe dem Leser iiberlassen. Eine leichte Folgerung ist: Jed 
Homomorphismus eines Zahlensystems in sich ist ein Isomorphismus. 

Das ist im Fall SS" schon bewiesen. Es sei also nun S"=S{€ 
Zu zeigen ist noch, da jeder Homomorphismus @ umkehrbar ist. Es s 
a“ = 6", 0° =c. Nach Hilfssatz 4 ist e—e,, ferner a7 —a+c—b-+¢, al: 
c+a—c-+6. Nach Hilfssatz 4 muB @.—e@, oder a—6 sein, w. z. b. w. 

Wir haben also die Addition nach einem einheitlichen Prinzip fiir d 
verschiedenen Zahlensysteme eingefiihrt. Es ist noch zu zeigen, da die i 
System der ganzen Zahlen Z erklarte Addition in der Teilmenge der Zahl 
= 0 gerade die im System der natiirlichen Zahlen definierte. Addition ergil 
Doch soll diese leichte Aufgabe hier nicht durchgefiihrt werden. 

Jedes Zahiensystem, als Struktur mit Nachfolgerfunktion erklart, wi 
also durch Hinzunahme der mittels seiner Isomorphismen in sich erklart 
Addition zu einer kommutativen additiven Halbgruppe (im Fall S= 
Gruppe). Es liegt nahe, nach den Homomorphismen dieser additiven Hall 
gruppe, ohne Beriicksichtigung der Nachfolgerbeziehungen, zu fragen. 
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HILFSSATZ 6. Ist S ein Zahlensystem, so existiert zu jedem Element 
s€S genau ein Homomorphismus der additiven Halbgruppe von S in sich, 
der die Zahl 1=O" in s iiberfiihrt. 


Bewels. U sei die Menge der Zahlen s¢€S, fiir die der gewiinschte 
Homomorphismus wu, mit 1“*=s existiert. Es ist O€ U; denn die Abbildung 
):xX—+0 fir alle x€S ist ein solcher Homomorphismus. Aus s¢€ U folgt 
wegen (x+y)*+ (x+y)—=x"%+x+y"+y, daB die Abbildung wos: 
x—+x+x mit der Eigenschaft 1" +! =$§ +1 gleichfalls ein additiver Homo- 
morphismus ist. (Dabei ist das — Zeichen nur im Fall S"—S zu beriick- 
sichtigen.) Also ist s+ 1¢€U und daher (nach dem Induktionsaxiom) U= S. 
Sind nun zwei Homomorphismen uw und uw’ mit 1*— 1" gegeben, so enthalt 
die Menge V der Zahlen x€S mit x= x" die Zahl 1 und mit jedem x 
wegen (x + 1)*=x"+ 1*=x" +1" —(x+1)” auch x+1 und (falls in S 
vorhanden) x—1. Also ist V—S, w. z. b. w. 

DEFINITION DER MULTIPLIKATION. Fiir beliebige x,y € S erkldren wir 
(20) XY = xv, 
wobei uw, den Homomorphismus der additiven Halbgruppe von S in sich 
bedeutet, der 1 in y iiberfiihrt. 

Es ist leicht, aus dieser Definition die tiblichen Rechengesetze fiir ganze 
Zahlen bzw. Restklassen mod n abzuleiten. Das sei hier nicht durchgefiihrt. 

Ist G eine additiv geschriebene (nicht notwendig abelsche) Gruppe, so 
existiert zu jedem g¢€G ein Homomorphismus uw, des Systems der ganzen 
Zahlen Z in G mit der Eigenschaft 

jie == gp: 
Dann kann man genauso ein Produkt von ganzen Zahlen n mit Gruppen- 
elementen g erklaren durch 

ng=n's. 
Natiirlich kommt dabei das iibliche heraus. 
Die hier skizzierte Einfiihrung der elementaren Rechenoperationen diirfte 
dem Standpunkt der neueren Algebra am besten gerecht werden. Sie ist 
analog zur Einfiihrung der Vektoren in der affinen Geometrie als Isomorphis- 
men des affinen Raumes, die alle Richtungen einzeln fest lassen und der 
Skalare als Homomorphismen der Vektorengruppe, die jeden Vektor in einen 
parallelen iiberfiihren nach ARTIN.’ 


(Eingegangen am 18. November 1957.) 


7 Im Kapitel II seines Buches. 
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ON A COINCIDENCE PROBLEM CONCERNING 
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Introduction 


Let us consider a telephone exchange. Suppose that the subscribers 
make calls at the instants 7,,7,,..., T,,... Where 0< 1, <T)<+9*< p< <0. 
It is assumed that v, is an arbitrary positive random variable and the inter- 
arrival times Tri;—T, (n=1, 2, 3,...) are identically distributed independent 
positive random variables which are independent also of 7,. Put 


(1) P {Tn41— Tr =X} = F(x) (n=1,2,3;....), 
further: 

(2) a |xaF (x) 

and ; 

(3) | p(s) =| ed F(x). 


0 
Suppose that there is an infinite number of available channels and that 
each call gives rise to a connection (conversation) on one of the free chan- 
nels. Denote by x, the duration of the holding time beginning at the instant 
Tt (n=1, 2, 3,...). It is assumed that the 7, (n2=1, 2,3, ...) are identically 
distributed, mutually independent positive random variables which are inde- 
pendent also of the, random variables t, (2 =1, 2, 3,...). Put 


(4) P{y, =x} = H(x) (i172. 30s) 
and 
(5) 0 =| xd H(x). 


REMARK 1. The usual assumption that {v,} forms a Poisson process, 
with intensity 4, is a particular case of the above one. Namely, in this case 
F(x) =1—e* if x=0 (e«=1/A) and the distribution function of 7, is also 
f(x) = 1—e™. if. x 20. 
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In the sequel we shall call the sequence {t,} defined above a recurrent 
process. If, particularly, @ <oe and the distribution function of 7, is 


+ {—Foyiay if x=0, 
0 


0 if oe OF 
then we shall call {v,} a stationary recurrent process. 
Accordingly, the Poisson process is a particular case of a stationary 


recurrent process. 
We mention here some important properties of the stationary recurrent 


processes. 
Denote by C(t) the distance between ¢ and the next incoming call 
Then in case of a stationary process we have P{0(t) =x} — F*(x) for all t=0. 
Denote by m(t) the expected number of calls taking place in the time 
interval (0, t]. Then, generally, we have 


(7) m()—= > Pinst} 


and in case of a stationary process m(t) = t/a. 


(6) B= 


REMARK 2. In the theory of the telephone traffic it is usually supposed 
that the holding times are exponentially distributed, i. é. 
8 H l—e _ if x=0, 
(8) HX) an if x<0. 


Then @=1/u. This particular case has an important property. Namely, if 
(and only if) x, is distributed according to (8), then we have 

P{z, = +x|z, =} = A(x) 
for all y=O. 

REMARK 3. The unrealistic assumption that the number of channels 
is infinite requires some explanation. Firstly, knowing the probability laws 
concerning this ideal model we can establish the correct design of a telephone 
exchange with a finite number of channels. Secondly, by the aid of this ideal 
model we can determine the law of the overflow traffic for a telephone 
exchange with a finite number of channels. 

Finally, we remark that the mentioned problem arises also for instance 
in the theory of counters or in connection with power-supply. 


NoraTIONs. Denote by 7(f) the number of the busy channels at the 
instant ¢ and put 7(t,—0)— 7, (n=1, 2,3,...). We say that the system is 
in state E, (kK=0,1,2,...) if k channels are busy. Let us introduce the 
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miting distributions lim P{n(t)=k} = Py and lim P{7j,—k} =P, (k= 
=0,1,2,...) if they exist. Further let their binomial moments be Bi = 


=> ( is and B,= —>(' |p, (r=0,1,2,...), respectively, if they exist. 


k=r 
ut P{n(t)=J} = P(t) i =0, 1, 2,...). 

Denote by »? the number of transitions E,>Exi (k=O, 1,2,...) 
ccurring in the time interval (0, ¢] and put M{7{"! — M, (Pig ke, Tr: eh, 
urther denote by Nyii(t) (k=0,1,2,...) the expectation of the number of 
ansitions £,,:—£, occurring in the time interval (0, ¢]. Finally, denote by 
(¢) the Lebesgue measure of that subset of the interval (0, ¢) which consists 
f all points uw for which 7(u)=k (k is a fixed integer). 

In this paper we shall distinguish four cases as follows: 

A) {t»} iS a recurrent process and the distribution of the random 
ariables y, is arbitrary. 

B) {tn} is a recurrent process and the random variables y, are expo- 
entially distributed. 

C) {t,} is a Poisson process and the distribution of the random vari- 
les "y, is arbitrary. 

D) {t,} is a Poisson process and the random variables y, are expo- 
sntially distributed. 


_ REMARK 4. We can describe the state of the system by the following 
ndom variables: 7(¢), the number of the busy channels at the instant f; 
t), the distance between ¢ and the next incoming call; y7,(¢), y.(¢),..., the 
stances between ¢ and the termination points of the conversations which 
e going on at the instant ¢ (if such are going on at all). 

It is easy to see that in the case A) the vector process {n(t), S(t); 
(é), y.(t),...} is a Markov process; in the case B) the vector process. 
(t), S(t)} is a Markov process; in the case C) the vector process {7(t); 
(é), 72(t), ...} is a Markov process and in the case D) the process {n(t)} 
a Markov process. 

‘It is possible to show that under general assumptions (a<~%, 9<oo, F(x) 
not a lattice distribution) the processes in question are ergodic. Supposing 
at @<oo and g@<oe and choosing an appropriate initial distribution for 
(0), (0); 7:(0), 7.(0),...} we can define the stationary process. In case of 
stationary process we denote by 7"(¢) the number of the busy channels at 
e instant f. 


REMARK 5. The process {7(t)} can be described as a secondary sto- 
astic process generated by a recurrent process (or a Poisson process, re- 
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spectively). Put 
y) Lot Os a 


(9) be 'O otherwise. 
If, especially, (0) 0, then we have 
(10) n= 2) ft—t 0). 


If the initial state is other than (0) 0, then (10) contains also an addi- 
tive term. 

If we suppose that @<oe, e<oo and F(x) is not a lattice distribution, 
then {7*(t)} can be considered also as a secondary stochastic process. Sup- 
pose that calls are arriving at the exchange in the instants t, (n=O, +1, 
+2,...) where —oo<-+*<T4<TH<M<-+-<0o and P{Tpyi—tr =X} = F(X) 
(n=0, +1, +2,...), further that the holding times 7, (n=O, +1, +2,...) 
are identically distributed, independent positive random variables with the 
distribution function H(x). Then we have 


(11) O= 2 _ St—t wm). 


RESULTS. In what follows we shall deal with the determination of the 
distributions {P,} and {Py} and that of their binomial moments B, and B; 
(r=0O,1,2,...), respectively. Further, in case D), we shall investigate the 
distribution of the number of transitions E,— x4: occurring in (0, ¢] and the 
distribution of the total sojourn time 4,(f) spent in states Fy, Fxii,... in the 
time interval (0,7). In addition we shall deal with some related problems. 

The above problems in the cases A), B), C), D) were investigated by 
the author [32], [34]. The case B) was treated by C. PALM [18] and J. W 
COHEN [4]. In the cases C) and D) the distribution {Pz} was determined bj 
several authors, namely A. K. ERLANG [5], F. POLLAczek [19], C. PALM [17] 
L. KOSTEN [14], R. ForTET [7], A. RENy1 [21], C. RYLL-NARDZEwsKI [22], B. A 
SEVASTJANOV [23] and others. 

Further we mention that the process {7(f)} arises also in the theory o 
counters. At Type II counter the main problems consist of the determination: 
of the probability P {7)(¢)—0O} and the distribution function of the numbe 
of the transitions E,— £, occurring in the time interval (0,7). (Cf. [35].) 

Finally, we remark that the author [27], [26] has previously given som 
general results concerning secondary stochastic processes generated by ¢ 
recurrent process (or a Poisson process, respectively). These results contait 
some theorems of this paper as a particular case. 
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§ 1. The case A) 


First, for the sake of simplicity, let us suppose that 7(0)=0 and 
P{v, =x} = F(x). In this particular case let P{n(t) = k} = P,(t) (k=0, 1, 2,...). 
Knowing P,(t), the determination of P{7(t)—k} in the general case can 
easily be reduced to this particular case. 

The process {7(¢)} may be considered as a secondary stochastic process 
generated by a recurrent process. In this case, to determine the distribution 
of 7(t), the method of R. Foret [8] or that of the author [27] can be 
applied. | am indebted to Mr. R. Syski (England) who has kindly called my 
attention to this possible way. 

Let us introduce the generating function 


-G(t, 2) => Pipe. 


THEOREM 1. The generating function G(t, z) satisfies the following integral 


equation : 
t 


(12) G@,2z)=[1—F)]+] G¢—x, 2) ie + I—2) H(t) dF). | 


Proor. By (10) we can write 
n(t)= Dd ft—ta, xn) 
0<t, St 


where f(u, x) is defined by (9). Earlier the author [27] investigated this pro- 
cess for arbitrary f(u,x). As a particular case of the theorems of [27] The- 
orem 1 and some further results can be obtained. 
Let us suppose that conditionally 7,— x, then 
f(t—x, mw) +H(t—x) if xSt, 

a ge if x>t 
Here 7(t—x) is independent of f(t—x, y,) and has the same distribution as 
n(t—x). Now the generating function of f(t—x, y:) is H(t— x) +2[1—H(t—x)] 
and the generating function of 7(t—x) is G(t—x,z). Therefore, by the aid 
of the theorem of total expectation, we obtain 


t 
G(t, 2) =[1—F()] +. | Gt—x, lz + (1-2) H(t) F@) 
lle F 
what was to be proved. 
Let us introduce the binomial moments B,(f) (r=0,1,2,...) of the 
distribution {P,(f)}, i. e. 


(13) | Bt) = 5 (‘| Pay 


k=r 


4 Acta Mathematica IX/1—2 


50 L. TAKACS 


THEOREM 2. The binomial moments (13) exist and can be determined 
by the aid of the following recurrence formulae: B,(t)=1 and 


(14) B,(t)= | Br-s(t—)1—H(t—a)Jdm(x) 71, 2,3,..) 

where i if 

(15) m(x) = > Fa(x) 

and here F,(x) denotes the n-th iterated convolution of F(x) with itself. 
Further 

(16 P= (" (2) 8.0. 


PRooF. It is easy to see that 
d’ G(t, z) ) = 
BAe (oe) Ae. (r =O, 72, «ans 
Clearly, B,(t)=1 and derivating (12) r-times with respect to z at z—1 we 
obtain 


B,(t)—= | B(t—x)dF(x) + | B-a(t—x)[I— H(t) FQ). 


This is a linear integral equation of Volterra type for the unknown B,(f). 
As it is well known, the solution is 


B,(t) = | B-s(t—x)[1—H(t—x)]dm(x) 


what was to be proved. 
To prove (16) we remark that there exists a positive constant C so that 


r 


G 
Namely, according to (14) we can write 


B(t)= | |---| [—H(—4))---[I—A(t—t,)]dm(t)---dm(t,). 


tttyt...tt. St 
_ Let now A be a fixed positive number, K(x) = H(x—A) and take into consider- 
ation that m(¢+-h)—m(t)=1-+ m(hA) for all t=0. Then we easily obtain that 


Be man) |f- | [i KG) [LOR Go ldx ea 


X+Xot... +2, Stt+h 
t+h 


if tm (0 
h 


—K(x)]dx)" 


? 


ee (' by (h+0)" 
r! eae h r! 


as stated. 
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Now it is allowed to invert (13) and so we obtain (16). 
The following theorem relates to the general process: 


THEOREM 3. If o<~, @<oo and F (x) is not a lattice distribution, then the 
limiting distribution lim P{7(t) — = k}=Py (k=0, 1, 2,...) exists, it is inde- 
pendent of the initial distribution and we have 


(17) => (-"{*) a, 


where B; is the r-th binomial moment of the distribution {Pr} and it can be 
determined by the following way: B*=1 and 


(18) wa, con—neoa (7102, 3s): 


PRooF. First we prove the theorem in the particular case when 7(0)—0 
and P{t,=x} = F(x). Next we shall show that it is true also in the general 
case. We need 

LEMMA 1. /f g(t) is a function of bounded variation in (0, %), a<oceo 
and F(x) is not a lattice distribution, then we have 


(19) lim fe¢—xamo) = 1 | g@oax. 


This easily follows from a theorem stated by D. BLACKWELL [3] which 
asserts that for any h>O 
2 M(t h)—m(f) sl) 

(20) ia aaa 
Estimating the upper bound and lower bound of the approximative sum of 
the integral 


t 
Jgt—xam@), 
0 
we easily obtain (19). (Cf. also W. L. SmirH [24], [25].) 
Now we show that lim B, (t)—=B; (r=0,1,2,...) exists and then we 


shall prove that B; (r=0, i‘ 2,..-) is the r-th binomial moment of the dis- 


tribution {P;}. 
Clearly, B§—1. Applying Lemma 1, from (14) we obtain that 


lim B,(t) = Bi exists and’ we have 


Bi fnee 


4* 
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Proceeding similarly, (18) can be proved by induction. If we suppose 
that lim B,1(t)—= Bt; exists, then, by Lemma 1, it follows from (14) that 
t+o - 


lim B,(t) = Bt also exists and (18) holds. 


t>o 
Since 
C 


By(t)= i 


for all f=0, consequently 
(21) lim G(t, z) = G*(z) 
t>+o 


exists and we have 
(22) G*(z) = > Br(z—l)’. 
The series (22) is convergent for every z. By (18) we conclude also that 
(23) G*(z) =1— | GG. z)[1—A (A) Jat. 
0 


Now G*(1)=1 and according to the continuity theorem for generating func- 
tions it follows that the limiting probabilities . lim P{7(t)—k}—= Pi 
t>+o 


(k =0,1,2,...) exist and we have 


(24) G*(z)= 2, Prez. 
Finally, by (22), 

we le or) Se (8) 
ize) P= 7h dz i a 1) k oe 


and it can evidently be seen that Bt (r—0,1,2,...) are, indeed, the bino- 
mial moments of the distribution {P;}. This completes the proof for our 
particular initial state. If we consider an arbitrary initial state, then the only 
difference is that 7(¢) is to be replaced by 7(ft—v7,)+<e(t),' where 7, is an 
arbitrary positive random variable, 7(t) has the same’ distribution as the par- 
ticular 7(¢) and lim P {e(t)—0}—1. Consequently, 7(t—7,)+(t) has the 
same limiting distribution as the particular 7(t) when t-+cc. This completes 
the proof for the general case too. 


Finally, we mention that the distribution {Py} can also be expressed 
as follows: ; 


(26) Ps; =1— 1 | pou—a@yat 
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and 
1 
(27) Pi = £ |. ®—POltI—HO) dit) «(k=21y2, 3). 
0 


REMARK 6. Denote by m(t) the expected number of calls in the time 
interval (0, ¢]. Clearly, we have 


(28) m(t) = Pts, <f}. 


If @<oo and F(x) is not a lattice distribution, then we can easily prove by 
the aid of the mentioned theorem of D. BLACKWELL [3] that for all A>0 

m(t+h)—m(t) 1 
pe 


a 


(29) lim 


t>+@ 
independently of the distribution of 7,. 
LEMMA 2. Denote by 6,(t) the sojourn time spent in states E,, Exst,..- 


in the time interval (O,t), then we have 
t 


(30) M{é..(t)} = > { Pyu)au. 


Jak 
0 


Proor. Define 


nO=lo it Hee 
Then 
a(t) =| ze(u)du. 
Since ; Fe 
M{xx(u)} = P {xe (u) = 1} = a P;(u)du, 
we get ” 


= fmt = [Pode 


0 


Mia) = M) i PROYE: 


what was to be proved. 


The stationary process. It can be shown that the Markov process 
{n(t), S(t); m(), yo(t),..-} is ergodic if e<oo, @<co and F(x) is not a 
lattice distribution. Accordingly, there exists a uniquely determined stationary 
process. If we suppose that 9e<oo and @<oo, then by choosing an appro- 
priate initial distribution we obtain the stationary process. In case of the 
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stationary process let us denote by 7*(t) the number of the busy channels 
at the instant ¢. Then we have P{7*(t)—k}— Pr (k=0,1,2,...) for all 
t=O. Further in this case P{C(t)=x}—F*(x) for all ‘20 and m(t)=t?/e. 


REMARK 7. In case of a stationary process we get by (30) 
G1) main} —(S Pre 


Let us introduce the following notations: M {7*(t)}=M and D*{7*()}=D*; 
then M= Bi and D?’=2B; + B;—B?. By (18) we have 


(32) M== 

and 

(33) p—2 {ao Hpjdt+ SET) 
where 


B,(t) = | (1—H(t—a)]dm(x) 
and m(x) is defined by (15). 


THEOREM 4. For the stationary process {n*(t)} there exists the correlation 
function 


(34) R(t) = seta t)} — M® 

and we have 

SI ACA as ay Lf Sie re 1, [mes +ne—onme— 
where y 

(36) h(x) =| (1—H@J— A(t + Oat 


and m(x) is defined by (15). 


Proor. This theorem is a particular case of Theorem 6 in [27] and so 
the proof is omitted. 


| REMARK 8. Denote by G*(w) the spectral distribution function of the 
process {7*(t)}. According to the theorem stated by A. JA. KHINTCHINE [10] 
we have 


(37) R(t) = | cos ordG*(o) 


and by inversion we obtain G*(w). 
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REMARK 9. The random variable 


(38) tl a@at 
0 


can be used to the statistical estimation of the telephone traffic. (Cf. e. g. 
L. KOsTEN [15], V. E. BeNES [1].) It is easy to prove that 


(39) M fs (t)dt} =M= £ 
and : R : 
(40) D* af arora = 2a | (T— a)R(t)dt 


where R(t) is defined by (35). 


§ 2. The case B) 


Let us consider the case A) in the particular case 
a l—e" if x=0, 

at M=)o if x<0 
when 0 =1/u. 

Introduce the following notations: g;—g(iu) (i=O0, 1,2,...), further 
C,==1 and 

J - 

(42) G=i=y V=12..). 

THEOREM 5. The limiting distribution {Px} (kK=0,1,2,...) exists and 
is independent of the initial distribution of {n(0),S(0)}. We have 


@ ¥ r 
(43) Peas) 18) C 
where C, is defined by (42). The r-th binomial moment of {Px} is 
(44) bas G; (Fae 07152, 0): 


Proor. It is easy to see that the sequence. of random variables 
{nn} (n=1,2;3,...) forms a Markov chain with transition probabilities 


P (7241 = k| qn = J} = Pw where 


fo) 


(45) Pix = ( F ') Jew —emy"" ar (a, 
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The Markov chain {7,} is evidently irreducible and aperiodic. By the aid of 
the theorem stated by F. G. Foster [9] can easily be proved that the states 
are also ergodic. Namely, to apply FosTErR’s theorem it is enough to con- 
sider the probabilities (43) themselves. Consequently, the limiting distribution 
lim P{7j,= k} =P, (k=0,1,2,...) exists and is independent of the initial 


distribution of 7, (and thus also independent of {7(0),6(0)}). The limiting 
distribution {P,} is uniquely determined by the following system of linear 
equations: 


(46) Pr= 2 PnP; (k==0, 1,2, -.:) 
<= 
and 
(47) =, P, =1 
k= 


(cf. W. FELLER [6], p. 325). 
To solve this system of linear equations, let us introduce the generating 
function 


(48) U(z) = > Piz". 
k=0 
By (46) we have — 


@ 


(49) U(2) = | (I—e#* + ze") U(1—e#* + ze) d F(x). 


Now let us consider the binomial moments B, (r= 0, 1, 2, ...) of the distrib- 
ution {P,}. As it is known 


(50): B, ->(') Py. 
k=r 
If B, exists, then by (48) we get 
(51) payee fe ve) 
r! dz2" ‘1 


Now by (47) B)=1 and forming the r-th derivatives of (49) at z—1 we 
obtain 
B, = (B,+ B,y-1) 9 (7r=1, 2, 3,...), 


eee 
B, = eer Back (r=1, 2,3, ...). 
Hence it follows by induction that 

(52) B,= C, (fe=0, 1, 2...) 


what proves (44). 
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We observe that lim g,—0O and therefore 


Thus taking (51) and (52) into consideration we can write 


(53) U(2z)= > C-(z—1)7 
r=U 
and this series is convergent for every z. Consequently, 
__ 1 (d'U) : ed 
(54) P= 1 re x) 4) 


what was to be proved. 

REMARK 10. As we have seen, to prove Theorem 5 it is sufficient to 
show that B.C, (r=0,1,2,...). Knowing B, (r=O, 1, 2,...) the distrib- 
ution {Px} can easily be determined. To determine B, we can apply the 
following heuristic way. Let us define a stationary Markov chain {7n} 
(n=O, +1, +2,...) for which P{7, =k} =P, (k=O, 1,...) for all n. Let us 
consider an incoming call in the stationary process. Define ¢, (2 =1, 2, 3,...) 
as follows: ¢,=1 if the conversation corresponding to the former n-th call 
is in course and «,—O if this is not the case. Then clearly 


(55) Py = P{e tates te+--=h} (k=0, 1,2,...) 


and 
Aone ep ae ay 
(56) B= M|| é \ 


where it is still to be proved that the expectation and the limit can be 
interchanged. Since 
ba oe | 
iA jrbigt tp S 0 


where j,, /o,...,j/- are positive integers, consequently 


=limM 


n>@ 


pamela She col 
ye 


&, jitjo fy i Eh tjote ty 


, Qtater +e ees 42 
lim M = ay me cai >, M {8}, 5,45" * *Sivtint-tiph 
n+o r j=l j=l j= 


A simple calculation shows that 

M{&),8:452"° *Eickigteutiph mae gh gir 
and, consequently, 
(57) B, 


what was to be proved. 


cae fet he Si MO isan ge. stat apt a 
~ 1—q, 1—q, 1—q, 
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THEOREM 6. Suppose that F(x) is not a lattice distribution and a<oce. 
then the limiting distribution lim P {7 (t) =k} = Pr (k=0, 1):2;.25) Coe 


and is independent of the initial ‘distribution of {7(0), 5(0)}. We have 


(58) r=2t Soy ig — §(k=172,3)29 
and 
(59) pbsieseceo tei 
aust 
Further the r-th binomial moment of the distribution {Px} is 
reat Cra as 
(60) Ses (f=a1.2 3.) 
while B)=1. 


Proor. We need a lemma. 

Lemma 3. Denote by M,(t) the expectation of the number of transitions 
Ej;— Ej: occurring in the time interval (0,t]. If F(x) is not a lattice distrib- 
ution and a<o, then for all h>0O we have 


(61) m M+) Mj(t)__ P; 


we a 


(7-0, 1s Deer 


PRooF. The time differences between consecutive transitions E;— Ej, 
are, as it can easily be seen, identically distributed independent positive 
random variables. If F(x) is not a lattice distribution function, then these 
random variables have not lattice distribution functions either. If @<oe, then 
these random variables have a finite expectation @/P,. Under these conditions 
according to an easy extension of the theorem of D. BLACKWELL [3] we ob- 
tain the limit (61) and this limit is independent of the initial distribution o} 
{7 (0), 6(0)}. It remains only to prove that the expectation in question is @/P; 
Let us consider the Markov chain {7,}. The state £; is a recurrent state anc 
the expectation of the recurrence step number is 1/P; (cf. W. FELLER [6], p 
325). As transitions E;— Ej, occur at such instants t, (n=1, 2,3,...) for 
which 7,—j, consequently the expected number of steps between consecutive 
transitions E;—+Ej,; is 1/P;. The expectation of the length of each step is a 
and so using the Markov character of the process it follows by the aid o 
the known theorem of A. WALD [36] (cf. A. N. KOLMOGOROV and J. V. PRo- 
HOROV [13]) that the expectation of the time differences between consecutive 
transitions E;— Ej,; is @/P;. This completes the proof of the lemma. 

To return to the proof of Theorem 6 we shall show that the limits 
lim P (q(t) =k} = = Px (k=0, 1, 2,...) exist and are independent of the initia 


distribution of {7(0), 5(0)}. 
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First we can write 
t 


(62) P{7n(t)=hk} ea > hes 1) fermen —enenyint [1— F(t—u) ]dM,(u). 


—=k- 


For the sake of brevity put 


(63) Te. (x) = t i ' e-kue(]—e-ne)itik 
and denote by 7, 7{,..., 7, ... the instants of the consecutive transitions 
E;— Ej1:. Then evidently 
(64) M(t) = 2 P {rt st}. 
} n=l1 


Now the event 7(t)— 4 can occur in the following mutually exciusive 
ways: the n-th (n=—1, 2,3,...) transition E;> Ej. (,—=k—1,k,...) occurs 
at the instant u (where O=u=f), i.e. ¢) =u and in the time interval (u, t] 
does not arrive any new call (let this event be Aw), further in the time 
interval (u,t] j-+1—k& conversations terminate and k conversations do not 
terminate (the probability of this is 2.(f—u)). Consequently, 


P{n(t)=k, Aw|t9 =u} = 2%(t—u)[I—F(t—o)] if O<ust 


and finally by the total probability theorem we can write 


t 
@ oo 


(65) Pin)=—H— SD | a —wll—Ft—wJaP (e Sa) 
j=k-1 n=1 
what proves (62). 
Applying Lemma 1 and Lemma 3 it follows that lim P{n(t)—=*} = Pi 
t>o 


exists and is independent of the initial distribution of {7(0),¢(O)}, further 


(66) Pt= > oe, 
’ Saas 
where 
1 
67) p= | an@oll—Foolas. 
0 


It is easy to see. from (66) that {Pr} is a probability distribution. The for- 
mula (66) gives {Py} explicitly, but we shall construct later a simpler formula. 
Introduce the generating function 


(68) U*(2) = 2, Be 
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By (66) we have 


(69) U*(z)= 4 fa—ew + ze") U(1—e* + ze“*)[1— F(x) ] dx. 


For the binomial moments 


| 1 (d’ ve) ey 
(70) B= S15 Jp: =+( errr (r=0, 1, 2,.. 
we have B;—1 and forming the r-th derivative of (69) at z—1 
| 1—q, esd 
(71) B, =[B8,-+ B,-1] rau (r=1, in Sys 


As we have seen earlier, 
B, =[B,+ B,-1]@, (fe) 52. 3.588 


(72) B pal 1 i Py Be a Ces 
Gr rau rau 


consequently 


what proves (60). 
Hence, using (70), we obtain 


(73) U*(z)=1 + a 


1) 
and this series is convergent for every 2z. Fae 


des a — oni 
(74) seeties (JS «123.8 


Te leer -_ 
nga. e (k = 0) 


what completes the proof of the theorem. 


THEOREM 7. The probability distribution {Pg} can be expressed by th 
distribution {P,} as follows: 


Pray 
i an 
(75) i Lieis FF (k=1, 2, 3,...) 
and 
. I . Py-1 
76 P; =)]—— > —, 
( ) 0 au k 


ProoF. First we prove a lemma. 


LemMMA 4. Denote by N,(t) the expectation of the number of transition 
E,— Ex-1 occurring in the time interval (0, t]. If F(x) is not a lattice distrib 
ution and a<oe, then we have 


(77) lim Ne(t)= P&ke — (k=1,2,3,...). 
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It is easy to see that 
Ni(t+ 4t)—Ni(t) = P{n(t) = kK} ku dt + o(dt). 
As lim P{n(t) =k} = Pz exists, (77) follows immediately. 
To prove Theorem 7 we observe that the difference of the number of 


ransitions F,-1—+£, and E,—E£,-; occurring in the time interval (0, ¢] is at 
nost 1. Consequently, |M.-1(f)—Nx(t)|=1 and hence 


| tim Me=tlt) UN 
t+o t tro t 
3y Lemma 3 we obtain 
lim M,-1(t) P, 1 
t+o 4 
ind by Lemma 4 
tim “prey 
t+o 


ind thus (75) is proved. Further, clearly, P* —1— >’ P= what proves (76). 
ci 


REMARK 11. For the sake of simplicity let us suppose that 7(0)—0 and 
r, has the distribution function F(x). Now in this particular case we put 
249,(t) =k} = P,(f) (= 0,1,2,...) and introduce the following generating 
unction : : 


78) G(t, z) = > Pi (t)z*. 
. k=0 
is now 
l—e" if x20, 
; He) =}, if x<0, 
ve can write by Theorem | that 


79) G(t,z)=[I—F()) + | G¢—x, aII— (Ie d FQ). 


’ I should like to mention that Mr. R. Syski was so kind to call my 
ttention to the possibility of such a treatment. Applying the results of 
2. FoRTET [8] or of [27], ‘Mr. R. Syski showed that for G(t,z) we have 


80) G(t,z)=1—(1—2) | G(t—x, ze d(x) 


yhere m(t) denotes the expectation of the number of calls occurring in the 
me interval (0, f]. | 

The integral equations (79) and (80) can easily be solved by Laplace 
ansform. Inverting the Laplace transform we can determine the probabilities 
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P(t) (k=0, 1, 2,...). Knowing the probabilities P,(t) for this particular 
_ case, the solution for the general case can easily be given. Now we shall prove 


THEOREM 8. Jf 1(0)=0 and P{t,=x}—F(x), then for the Laplace 
transform of P,(t)—=P{n(t) =} we have 


% « (—1)" 
(81) \ e* Py\(t)dt = > 


0 


tf) as 7 9(s+iv) ay pe 
st+ju i] —9(s+in) J ees 


and 
 upnat- 1 — Sev" fr_os+in 

(82) Je '‘P\(dt =~ > ee Bos. 

Proor. Introducing the Laplace transform 
(83) w(s, 2)=|e"Gt, 2) dt 

0 
we obtain by (79) or by (80) that 
_1_ (G—2)¢(s) 

(84) V6 2)=— — “Fagg ¥E+ M2). 


By successive applications of this formula we can express w(s,z) with the 
aid of w(s+au, z) (n==1,2,3,...), respectively. If we take into consider- 
ation that lim ay(s+ ne, z)=0, then, finally, we get an explicit formula for 
ap(s, 2), namely : ; 1 
—1)'(I—z)’ 77 p(s +in) 
85 $, Zz) = ( : —, 
(S) este) a > regret | varies 7 


This series is convergent for every z if R(s)>0O. Forming the coefficient of 
z* we obtain 


fe"P.(Hat 
0 


what proves (81) and (82). 
Inverting the Laplace transforms we can determine P,(#) (k=O, 1, 2,... 
uniquely. We have shown that lim P,(t)—Py (k=0,1,2,...) exists anc 
t>+o@ 
then clearly 


ies) 


(86) Py =lims | e-*P,(t) dt. 
s->0 


0 
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Since 


we easily obtain that 


os () Tp hiv) 
Bf P ~~ eu a ae Se Ne — eee 
( ) k ae J k iT 1— (ip) (k if, ies 3, ) 
and 

. 1 $1)" 77__ ¢liv) 
88 pee ene Shae as Pas FE) S | 
e ‘ aur J HT 1—g(in) 
where the empty product means 1. These results are in agreement with 
Theorem 6. 


The stationary process. Denote by {&(t) the distance between the 
instant ¢ and the instant of the next incoming call. The conditional limiting 
distributions of C(t) are described by the following 


THEOREM 9. If @<oco and F(x) is not a lattice distribution, then there 
exist the following limiting distributions : 


(89)" lim P{E(*) Sx|n()=K F(x) — (k=0,1,2,...), 


where 


(90) Fe(x)= 


=k- 


LS lit") fema—em>"1Re+3)—FUney 


and they are independent of the initial distribution of {n(0), 5(0)}. 


PRooF. We can proceed similarly as in the proof of Theorem 6. Apply- 
ing similar notations we can write 


M1) PHSx n= KH = > | aelt—w)[FC+x—s) Fwy) am. 


The event {C(t) =x, n(t) =} can occur, namely, in the following mutually 
sxclusive ways: the n-th (n 1, 2, 3,...) transition E; + Ej (;—=k—1,k,...) 
yccurs at the instant u (where O=u=f), i.e. vu and in the time 
nterval (0,¢] new calls do not arrive (event A.) and the next incoming 
all occurs in the time interval (t,¢+-x], further in the time interval (u, f] 
'+.1—k conversations terminate and & conversations do not terminate (the 
srobability of this is 7(t—u)). Consequently, 


P{E(t) =x, n(t) =k, Au|o = u} = a (t—u) [F(t + x—u)—Ft—u)] 
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if Oust and by the aid of the total probability theorem we obtain 
3 P{C(t) =x, nO=Kh= 
(92) o 


=> 2 rx.(t—u)[F(t-+ x —u)— F(t—u)]dP {cr <u} 
poe 
what proves (91). 
Applying Lemma 1 and Lemma 3 it follows that lim PK) < =x, 7n(j=h = 


== Pe Fy (x) (k=O, I, 2,...) exists and is fntiependent of the initial distribu- 
tion of {7(0), 6(0)}. Finally, since lim P {7(t) =k} = Pk, we have 


= \ tim OSs n= k 
(93) lim P{S(t) = x|n(t) =} = lim Pi()—h Fi (x) 
what was to be proved. 

Thus we have shown that the Markov process {7(f),o(t)} is ergodic if 
@<oo and F(x) is not a lattice distribution. Accordingly, there exists a 
uniquely determined stationary process. Namely, if we suppose that @<oce 


and the initial distribution of {7(0), ¢(0)} is 


(94) P{5(0) =x, nO—=K=FF) — (k=0,1,2,...), 
then {7(t), S(¢)} will be a stationary stochastic process for which 

(95) P{o(t) =x, n(f) =k} =P; Fr (x) (k=0, 125.4) 
for all t=O. 


In case of a stationary process {7({t),o(t)} the Markov chain {7),} will 
also be stationary and we have for every na 


(96) ) P {nn =k} = Py (k=0, 1, 2,...). 
This is a consequence of the identity 


(97) P,= > oat e-kur(]—e-ur) 1k F(x), 


REMARK 12. In case of a stationary process {n(f), $(¢)} we have 
(98) P{o(t) =x} = F*(x) 
for all f=0 and, consequently, in this cage {t,} forms a stationary recurrent 
process. 
Further, in case of a stationary process we have 
(99) M(t)}=FE  (k=0,1,2,...) 
and 
(100) Nisi(t) = Pyut (k= 0, 1,2, ...). 
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Palm’s functions. Hitherto we did not make any restrictions concern- 
ing the servicing of the calls. Now following C. PALM [18] let us suppose 
that the channels are numbered by 1,2,...,7,... and an incoming call 
realizes a connection through the idle channel which has the lowest serial 
number. This assumption does not restrict the generality, since {n(t), ¢(t)} is 
independent of the system of handling of the traffic. Now, denote by 
7, TY,..., 0, ... the instants .of the calls which find all the channels in 
the group (1,2,...,r) busy. It is easy to see that the time differences 
Tv”), —t” (n=1,2,3,...) are identically distributed independent positive 
random variables. Denote by G,(x) their common distribution function. 

C. Pam [18] has proved that the distribution functions G,(x) 
(r—1,2,...) satisfy the following system of integral equations: 


(101) G(x) =G,-1(x) — | (I—e")[I—G.(x—y)]dG-a(y) (7 =1,2,3,...) 


where G,(x) = F(x). 
Let us suppose, namely, that 7) = 7°-) (where 1® —T,). Then clearly 
ev +(l—e")G,(x—y) if OSysx, 
P(r, —mM sx|te— re = y} = 0 if y>x 
and by the theorem of total probability we have 


Fo 
. 


—7" =< x} =| [e-vy + (1—e-#") G,(x—y)]dG,-1(y) 


0 


G,(x) =P {rf}, 
what proves (101). 
THEOREM 10. Define . 
(102) y(s)=J e-=dG,(x) (r=0,1,2,...), 


then we have 
(*) 7 1—¢(s+- ip) 


Mae REA) ad 0,1) 20 
(103) ee Sey j-l 1—g(s+iz) (r y ty ty ) 
\ i Jaw tiv) 


where the empty product means 1. 


Proor. Taking the Laplace—Stieltjes transform of (101) we obtain 


PALM’s recurrence formula 

pa YrrA(Ste) Me ee 
p04) POS sesarore AL ) 
where 7o(s) = 9(s). 


5 Acta Mathematica IX/1—2 
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Introduce the following functions : 


“(r) 77 1—g(st+iz) 
=e > fae Ol1, 27. 
It is easy to see that 
1|— 
(106) D,41(s) = D,(s) + ae Di(s+e) (r=0,1,2,...) 
and a simple calculation shows that 
- _D,{s) E 4 
(107) y-(s) = Deals) (r230,1, 2) 
satisfies (104) and y,(s) = ¢(s). 
REMARK 13. Define 
(108) a, =| xdG,(x). 
0 
Since 
See) 
s+>0 Ss 
and 
lim we AY =, 
0 S@p(S) 
we have ' 
37) 77 1G) 
l — : a OED Ae 
oe ¥ eS (JH pin) i! 


REMARK 14. Let us consider the stationary process. Denote by JI, 
(r=1, 2,3,...) the probability that an incoming call finds every channel in 
the group (1, 2,...,7) busy and put JJ, —1. C. Pam [18] has showed that 


ott: 4 ee 
Sue 


(Cf. also F. PoLtaczex [20], J. W. COHEN [4] and the author [32], [33].) It 
is easy to see that 


(110) ie (r= 0, 1,2, 03, 


(111) a, =F (r=0, 1, 2,...) 
and thus (110) follows from (109). 
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§ 3. The case C) 


Let us suppose that {v,} forms a Poisson process with intensity 4 and 
I(x) is arbitrary. First let us suppose that 7(0)—0 and put P{n(t) =k} = 
= P,(t). In this case the following result is well known: 


THEOREM 11. /f 7(0) =O, then we have 


a|a—H@pyaxt 


t 
= f [1-H(a)] dx 


112) Rujy=e* Al (Ke ONS 2s ses) 
nd if o<oe, then there exists lim P,(t) = Ps where 
t+o 
. Ao) 
113) Pt ere “Oh ee 120), 


This theorem is plausible taking into consideration the investigations 
f A. K. ERLANG [5]. (Cf. L. KOSTEN [16].) If we suppose that the limiting 
istribution {Py} exists, then (113) follows from the results of F. PoLLACZEK 
19], C. PALM [17] and L. Kosten [14]. Further (112) and (113) follow from 
more general result given by the author [26]. An immediate proof for (113) 
yas given by A. RENyI [21], R. FORTET [7] and C. RYLL-NARDZEwSKI [22]. 


Proof. By the aid of the theorem of total probability we can write 


14) P{,(t)—k} = > e-M the (7) [fone )ax| [+ fac] 


or the event 7(t)—4 can occur in several mutually exclusive ways, namely 
1 the time interval (0, ¢) n (n=O, 1, 2,...) calls can occur. The probability 
iat n calls arrive in the time interval (0, ft) is 


ee) 

: n! 
is known (cf. [26], p. 233) that under the condition that in the Poisson 
rocess in the time interval (0,7) there occur exactly n calls, the joint distrib- 
tion of the instants of these calls agrees with the joint distribution of nr 
idependent random points distributed uniformly in the time interval (0, f). 
‘hus under the condition that in the time interval (0,¢) there occur n calls, 


1e probability of.7(t)—k is 


i ErJo ieee ax] fu (x) ax| 


0 
hus we get (114). 
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Since 
lim ii —H(x)|dx =e, 
t+o@ 
0 


we conclude that lim P {n(¢) =k} = Pr (k=0, 1, 2, ...) exists and (113) holds. 
to 


If we consider instead of 7(0)=0 an arbitrary initial distribution, then 
the new P,(t) can easily be obtained by the aid of (112) and we get again 
the limiting distribution (113) independently of the initial state. 


REMARK 15. If M(t) is the expectation of the number of transitions 
Ex—Exs1 occurring in the time interval (O,¢], then we have 


(115) M.(t) =2.{ Pe(u)du. 


Namely, the transitions F,— Fis: in (0,¢] can be obtained in such a 
way that we consider each call in (0,¢] and take into consideration only 
those which occur at such instants when there is.a state E,. Thus we get 


(116) M,(t+ 4t)— Mi.(t) = P,(t)Adt + 0(4t) 
what proves (115) 


The stationary process. Under the condition that 7(t)—4, denote 
by y(t), xo(t), -.-, x(t) the distances between ¢ and the termination points 
of the conversations which are going on at the instant ¢. 


THEOREM 12. /f @<oo, then we have the following limiting distribution: 
(117) lim P{zi(t) Sx, y(t) Sm, .--) ret) Sal = 


= H*(X,)H* (x2): ++ H* (xx) 
where 


1 y a 
(118) Hy —)eJU-HOMdy if x=0, 
0 
0 Tee Se 
and the limiting distribution is independent of the initial state. 


PRooF. First we suppose that 7(0)—0. In this case. proceeding simi- 
larly as in the proof of Theorem 11 we obtain by the aid. of the theorem of 
total probability that 


Pin(t)Sx, ya(t) Sm, ..-, x(t) Sxe3 n(t) =k} = 
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— Sete) face)” 77} ftmecrsr— nea - 


ie -H(2)] dx on 
=e 11} jv +x)— A(x) dx}. 


Hence, by (112), 
P{x.(t)=x, Wall) == 05, 262s xe(t) =x |n(f) =k} = 


oy jaa 


t 
= {—A(@lax 
0 : 
If t—+oo, then we obtain (117). If we consider an arbitrary initial state, then 
the only difference is that 7(t) is to be replaced by 7(t)+<(t), where 
lim P {e(t) 0} —1 and, consequentiy, we obtain the same limiting distribu- 
t>o 


tion as above. This completes the proof. 

Thus we have shown that the Markov process {n(t); 7,(t), xo(t), ..-} is 
ergodic if @<oo. Accordingly, there exists a uniquely determined stationary 
process. If we suppose that e<co and 


P{7,(0) =x, 72(0) Sa, «- -, Ze(0) = Xe; (0) =k} = PLA" (x) H* ()-+-H" (0), 


then we obtain the stationary process. In this case {7(t); y:(t), x(t), ...} has 
the same distribution for all ‘20. For the stationary process let us denote 
by 7*(t) the number of the busy channels at the instant t. Then we have 
Pier (ft) =< Kk} == Py (k =0,1, 2,...) for all £20. 

REMARK 16. The stationary process {7*(t)} forms a particular case of 
the secondary processes investigated in [26]. The following statements can 
be proved by the theorems of [26] or by an immediate way. 

If Bt denotes the r-th binomial moment of 7*(t), then we have 


(120) B= 40) (012s...) 


Especially M{7*(t)} =Ao and D?{7*(t)} = Ae. 
The correlation function R(t) exists and we have 


(121) ? rays 1 \t—Helax. 


Ie| 
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Denote by G*(w) the spectral distribution function of the process {7*(f) 
Then, by the theorem of A. JA. KHINTCHINE [10], we have 


(122) R(t) =| cos wrdG*(w) 

and by inversion we obtain 

(123) ICA = J (1—cos wx)dH(x). 
0 


The above results were proved by V. E. BENES [2] in another wa 


For the average traffic 
: 


(124) 1 farat 

we have ; 

(125) M J nat = 

and : 1 

(126) D’ J arwarl = 220 | (Ta) R(a)de 


where R(r) is defined by (121). Thus 


(127) D? It freoae a fi [(I—H()Jdx+ 4 fe T—x)[I—H (Jax. 


0 


§ 4. The case D) 


In this case {t,} forms a Poisson process with density 4 and 

l—e if x20 

128 H(x) = pee 

ee ©) =) if x<0 

when e=1/u. In this particular case {7(t)} is a.Markov process. 
If, particularly, 7(0) 0, then by (112) we obtain 


sea i 
k! 


_ML-e7 Hy | 


(129) P.(t)=e # (k=0,1,2,...), 
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and by (81) and (82) the Laplace transform of P,(t) is 


-st a i 
(130) fe Pa(tdt = (19 sei eH 


namely in this case 


(k=0, 1, 2,...), 


A 
Oe aa 
If 7(0)=k, then as an easy consequence of (129) we obtain that 


A(l—e**) |" 
uu 


(31) Pin) =j—=E(Ka—esriewe no Gm 


and clearly 


ny 
(132) lim P{n(t)=j} =e * —— 
t>o 3 
independently of k. 

The distribution of the transitions E,— £,,,. Denote by 1, 7®,..., 
t),... the instants of the consecutive transitions E,—+ Ej... (k=O, 1, 2,...). 
It is easy to see that the time differences 1, —r (n=1,2,3,...) are 
identically distributed independent random variables. Denote by A(x) their 
common distribution function. Further put 


(133) ya(s)= Jed R(x), (134) ox = | xd R,(x) 
and , 
(135) a= i (x—0,)°dR, (x). 
THEOREM 13.* We have 
Sh Dae, Sie Le Ee ee 
Jat SFE sts tiy-+ ee | 
(136) x 


[Ee (i ) Ga GD | | 


* Note added in proof. In the case B) we have the following generalization of (136): 
we ee 41) 3-11 y(s + in) ay (,) 7 9s +ie) le 
no—- |] S'( j Mi ex ene p(s in) ae ld ice tin|t 


(Cf. the author’s paper: “On the limiting distribution of the number of coincidences con- 
cerning telephone traffic’ submitted to the Annals of Mathematical Statistics.) 
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further 
(137) °. 25 1\ 
oe () 
and we 
(138) amp Bel a 
~elitd Gearla} (25)+1 


Proor. Let us consider the process {7(f)} with initial state 7(0)—O. 
Denote by G,(x) the distribution function of the distance between t=O and 
the first transition E,—-E,, further denote by G,(x), G.(x),..., G(x) the dis- 
tribution functions bf the distances between the successive transitions E,—£,, 
E,—E,, E,—E;,..., Ex—Exs1, respectively. It is easy to see that the distrib- 
ution functions G,(x) (r—=0,1,2,...,4) are the particular cases of the 
PALM’s functions G,(x) defined by Theorem 10. In our case o(s) =A/(A+3) 
and we have 
(139) rs) = ES) (r=0, 1, 2,...) 


where 
(140) B,(s) =a"? + pale ') sis +ue-(s- maa” (r= —1, 0, 1,2,.08 
(cf. C. PALM [18] and A. JA. KHINTCHINE [11]). Namely, in this case, especially, 


1 
D,(s) = ra -1(S). 
Now, in our particular case denote by M,(t) the expectation of the 
number of transitions E,—£,,; occurring in the time interval (0,f]. Then it 
can easily be seen that 


@ 


~st __ Yo(S)7i(S)+**¥x(S) jet 
and 
Sct Mi(t)=2P.(t) 


where P,(t) is defined by (129). Thus by (130) we obtain 


(143) fenamct) na ife“P(nat =1> (~1y"* (Z) ew ew 4 
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Comparing (141) and (143) we obtain (136). Further if we take into 
consideration that 


1— yy, “cis 
(144) =e) = 01. — gree —j5— s+0(s) 
if s—+O, we obtain (137) and (138). 


REMARK 17. We now suppose that 7(Q) is arbitrary. Denote by 1 the 
number of transitions E,—E,,: occurring in the time interval (0, t]. Inde- 
pendently of 7(0) we have 


M{v} 
145 +, Maat aS ELS 
p45) es t Ox 
and 
‘ Dy} or 
(146) lim ———— 


to t ays ; 


Further the random variable 24") has an asymptotical normal distribution as 
t—-o, namely 


he) — t F 
(147) epee 1s Pee, | wale | eviay 
t+@ / ort = Vz. 
0: i 


(cf. [29]). 
Denote by (tf) the Lebesgue measure of that subset of the interval 
(0, t) which consists of the points u for which 7(u)=Kk. 


THEOREM 14. If t—+co, then £,(t) has an asymptotical normal distribu- 
tion and is independent of the initial state. We have 


Bt x 
b(t) — 
(148) lim P Oe + Br 


a EX a) even 
t+o | ate sealers Van 4 ae 
(a. + &.)° 
where 
1. f{k\(uV 
32 =r S biz): 
Peta onl pet aihid | BI cane be Se: (ey) St 
(150) 0, ,.= A El +e-a ea) i) a7 


(151) a=z 3 eae 
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and 

(152) : Op = — Fs, x 

where o? is defined by (138) and o7 , by (150). 
Further we have 


_ M{&(t)} Be 
(153) yi t Gop Be 
and Ro 
: D*{G.(t)} & 05 et By 
Men) Lary, (ath 
Proor. Let us consider the instants of the successive transitior 
Ex — Exai, Exai—m Ex, Ex— Exss, ExsimEx,.... It is easy to see that the tim 


differences between such transitions are independent positive random variable 
namely the distances between consecutive transitions Ex41— Ex and F,— Ey, 
have a common distribution function, say G,(x), and the distances betwee 
consecutive transitions E,— Fx: and Ex: EE, have also-a common distribt 
tion function, say H,(x). Put 


(155) a f xdGi(x), &= [xa te) 

and ‘ : . f 

(156) 02 =| (x—a)'dG.(x), 03, = | (*—A)*d Hi(2). 
It is evident ie “ 

(157) Re(x) = | Ha(x—y)d Gel) 

and, consequently, we have 

(158) On = he + Pr 

and 

(159) a=, +0, 


We have seen that o? is finite and therefore o7, and of ,, are also finit 
In this case we can apply "Theorems 1, 6 and 7 of ‘out paper [30] (cf. al: 
[31]) and it follows that (148), (153) and (154) are valid. It remains only 
prove (149), (150), (151) and (152). 

We have seen that 


(160) Jed Ru(x) = yu(s) 
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where yx(s) is defined by (136). Further it can easily be seen that Gi.(x) is 
just the PALm’s distribution function for which 


(161) femdGxs) —n65) 
0 
where 7:(s) is defined by (139) and (140). 
Taking (157) into consideration we obtain by Laplace—Stieltjes trans- 
form that 


@ 


oe _ Wx(s) 
(162) Je dH,(x) = Pe 


0 


Knowing the Laplace—Stieltjes transforms (161) and (162) we can write 
clearly that 


@ 


(163) fe * A G,(x) = 1— as + —— Sahat s*+ 0(s”) 
0 

and 

(164) Jewati() =1—f6,.s+ BES s* + 0(s?) 


0 


if sO. Hence we obtain (149), (150), (151) and (152). This completes the 
proof of the theorem. 


REMARK 18. We shall now give another method to prove (149), (150), 
(151) and (152). Let us suppose that 7(0)—k (k is fixed) and put 
Pin(t)=/} =P,(t) and limP{n()=s} =P; ((=0,1,2,...). By (131) we 


have ji 
; Wa alee 
(165) pn— > ( Ja-e ut)k-i p-int = aig = 


and, consequently, 


e) 
(166) | lim P(t) = P et oe 
where the convergence is of exponential type. 

In this particular case also denote by M(t) the expected number of 
transitions E,— E,,, occurring in the time interval (0,¢) and by Nxii(t) the 
expected number of transitions E,.1—£, occurring in the time interval (0, f). 
Clearly, we have 


(167) Mi(t) =4Px(t) 
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and 
(168) Nii (t) = (K+ 1) 4 Pest (ft). 
Further it can easily be shown that 

; Lt Mat 
and 2 

bt ___ ¥x(s) 
(170) fe dNua() = Gy ; 


0 


Comparing (168) and (170) we obtain 


(k+ Nu fe*Prult)dt 
(171) PACS mer ce 
1+(k-+ 1) [e*Pua(tydt 


0 


Hence, by (169) and (167), 


2 ile“ Py(tdt 

(172) [endGu(n) = 7(s) = 0 te ee 
: 14+ (k+1)e |e’ Pa(t)dt 
further by (162) i 
> (k+ 1)u fe“ Pra (fat 
(173) J od Hi (sy) = (Uw) aot Boe Ce 
7«(S) © 
. A|e“P,(t)dt 


Q 
Using (165), the Laplace—Stieltjes transforms of Gx(x) and H,(x) can 
be obtained explicitly. But it seems that the formulae obtained in this way 
are more complicated than the earlier similar formulae (cf. [28]). We shall 
now show that the expectations and variances in question can easily be de- 
termined by (172) and (173). Namely, we shall show that 


io pak 
(174) a, = iP, A 

per le 
(175) oe my oe 


) R ing ee 
(176) a matt (2a efepeeer eR 
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and 
177 ee ja eel Rot Rite +Re 
(177) =A (28 P, ps) +2 TP, 
where 
y| J 
(4) 
(178) Pee ee 01,2...) 
i 
and 
(179) B= Pot Pit +P. 
Further 
2 Babe 
180 prt i te a 
ee pee tell a 
and 
Ap Real eS 1S id 
pa!) RAR SS 7 Sa. 
To prove the above formulae let us introduce the quantities 
R=|[PQ—P]dt (j=0,1,2,...) 
and : 


@ 


S =) t1P()—Plat (een). 


R; and S; exist because lim P(t) = = P; and the convergence is of ex- 


ponential type. Clearly, we have 


@ 


(182) fe“P,@)dt = Ps +R,—S)s+0(s) 
0 


if sO. 

Substituting (182) in formulae (172) and (173), by virtue of (163) and 
(164) we obtain that * 
1+(K+1)eRiit—ARe 


(183) Chee Sasso Ses ggh wll 328) 
AR. —(k+ 1) eR, 
(184) oi, =—— pe ae 
R 5 ASe—(k + Ne Sint 
(185) a=, (2% + «,|—2 pe 
and 


AS. —(k + 1)uS, 1 
(186) of = 8,28 a] 4.2 Ot De See 


where we used that (K+ 1)uPri1 = 4Px. 
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We remark that by (158) and (159) .we have 


1 
(187) Ox = Oe + Pe = AP, 
and 
(188) = 02, + 08, = 20, p+ o(ta— fh). 


In the above formulae only R; and S; (j=0,1,2,...) are unknown. 
In order to determine R; and S; we observe that P,(t) (j=0, 1, 2,...) satisfy 
the following system of differential equations : 


(189) oe 5D = Doty Cee 0,1, 25.) 
where 
(190) P(t) = G+ Ie Pin ()—APi() (j=0,1,2,..-), 
while ®_,(¢)=0. The initial conditions are 
1 if j=k, 
AMES bs if jek. 


By (189) we get 
| @@)at = | O.()dt+P;—P,O) 
0 0 
and by successive applications of this recurrence formula we obtain 


@ 


| ®,(t)dt — s [P.—P.(0)]. 


0 
It is easily seen that 


oo 
Yi 


(191) GIR a= | (Dat= > P—P.O) 


and putting 7k we get 
(192) (A+ 1)e Rii— AR = By —1. 


Substituting (192) in (183) and (184) we obtain (174) and (175), 
respectively. Further by (189) we get also 


@ @ 


[t@,(t)at—[1®,,at—R, 


and by successive applications of this formula we obtain 


@ 


| tD,(t)dt = —(R, + ++ +R). 


0 
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ince 
93) (A+ 1) eS — aS, = frond — (Rt + -+R,), 


is proves (176) and (177) by Firtue of (185) and (186), respectively. 
Finally, it remains only to determine the unknown R; (j=0, 1, 2,...). 
y (191) we obtain 


‘ Dee (7==0, 1,...,k—1), 
94 IHR —ARi= } 
) G+ 1)eRin—A; Be hls 2 sind 
id clearly , 
95) eis 
j=0 


he difference equation (194) can easily be solved (cf. CH. JORDAN [12]). 
aking into consideration that (j/+1)uPj4:—AP; from (194) we obtain 


f | i (j=0,1,...,k—1), 

96 hing piled Be 

SUE, Se Ges kek anh, es) 
AP; ——- 7 >: yon efe 


Summing up the above equations, we get 
RR SRB F1 hy 
? Lee oes TT TE UN Ph) 
hat proves (181). Finally, R, can be determined by the aid of (195) or by 
ie following way: Clearly 


98) P(t)=e Oey = > 1)" (Bye (em! 


nd therefore 


199) | r= fir —Pyat——4 i> on ae B fis b ay 


i=1 


hat proves (180). 
’ We remark, further, that the identities 


B= znl)(e] 


parla) 
yF P; said dae! 
old which may be applied in the formulae (174), (175), (176) and (177). 
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OSCILLATION AND MONOTONITY THEOREMS 
CONCERNING NON-LINEAR DIFFERENTIAL EQUATIONS 
OF THE SECOND ORDER 


By 
I. BIHARI (Budapest) 
(Presented by P. Turdn) 


Introduction 


There are known theorems stating the existence of an oscillating solu- 
on of a linear or non-linear differential equation of the second order and 
Iso theorems stating the monotonity of the amplitudes (SONIN’s and POLyA’s 
1eorem). Only one will be quoted here: that of W. E. MILNE! concerning 


le non-linear equation 
"+ P(X)F(y) = 0. 


et g(x) be a positive continuous increasing and bounded function for x =a; 
le function f(y) an increasing odd one and f(y)€Lip(1) for |y| =. 
‘aking a real value 71 (0<|7| =) the theorem states for x = a the existence 
nd uniqueness of a solution subjected to the initial conditions y(a)=— 7, 
‘(a) =0 and this solution oscillates infinitely often for x2 a, the ampli- 
ides decrease but do not approach zero. 

The present paper discusses the generalization of this theorem and cer- 
in comparison theorems of Sturmian type concerning the “half-waves”, 
quarter-waves”, “amplitudes” (see below the explication of these expressions) 
nd the distances of the zeros. 


§1 


One can raise the question what a condition imposed on the function 
(x,y, y’). involves the existence of an oscillatory solution of the equation 


) y=): 
will be shown here that the separability of the variables of f(x, y, ’) leads 
) such conditions. — We shall prove the following generalization of the 


dove-mentioned theorem of W. E. MILNE: 
THEOREM 1. Suppose that in the non-linear differential equation 
) ! V+ eXS(VA(Y) =0 


1 W.E. Mine, A theorem of oscillation, Bull. Amer. Math. Soc., 28 (1922), pp. 102—104. 
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1. (x) >0 is continuous, increasing and bounded for x =a; 

2. f(y) is an odd? non-decreasing function and f(y) € Lip (1) for | ys =6 

3. h(u) >0 is non-decreasing for u=O0 and non-increasing for u =0 
further h(u)€ Lip(1) for all u;* then equation (1) has a unique solutioi 
subjected to the initial conditions y(a)=7, y(a)=0 (0<|n| =6); this solu 
tion exists for all x = a, oscillates an infinite number of times, the ampli 
tudes decrease but do not approach zero and y’ remains bounded too. 


Proor. Being f(x, y,u)=9(x)f(y)A(u) continuous in the domaitr 
x =a,\|y|=6 and u arbitrary, the existence of the desired solution in a cer 
tain right-hand neighbourhood of a is already clear. In order to prove thi 
uniqueness of the solution, we shall show that the function f(x, y,u)= 
= (x)f(y)A(u) satisfies in y and wu a Lipschitz condition for ly| = 
(u. arbitrary and x 2 a). 


On. account. of 2: and 3, 
|F(X, Yo, Us) —F(X, Vi, 4y)| = P(X) | F(92) A (42) —fF(WDA()| = 
= 9(x)|f(y2) Fy) AC) +|F(92)| |A(a2)—A(uy)| S 
= 9(x)(Ki|Yo—y,|A (0) + Ko| uo 1 |F(6)) = M(\¥e—1 | + | 2 — |), 


where M=L max (K,h(0), K,f()) and L is the least upper bound of 9(%) 
i. €. L=Jim | £(X), further |y,| =, |y2.|=06, u, and uw, are arbitrary, K;, anc 


> 


k, are the! ececnie constants of f(y) and A(u), respectively. We must shov 
the existence of the solution for all x =a. Equation (1) maybe written i il 
the form 


(1’) Roy t POMODY =0. 
By means of the notations 
ee | 
Jroat= Foy, [ pieatHw (HE ~) a +0) 


this can be written as follows: 


a“ VAL ae 2h By ae edt = Ste) rg, 


® In order to prove the oscillating character of the solution, it is sufficient to assum: 
instead of “f(y) is odd” that sg f(y) = sg y. 


8 E. g. A(u) may be an even function decreasing for u=0. 
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Hence, making ‘use of Stieltjes integral, we obtain the following two equations : 


(2) go H(y)+ 9(3) F() = | F(0) 4908) + 9(@) Fn) 
Byjessr2n HU) H(y') 
eet HD Hy) —— [HO + 


The function F(y) is positive for y+:0, F(0)=O and F(y) is an even - 
function and increasing for y>0O. The function H(u) is positive, except at 
n= 0 where H(0)=0, and H(u) is increasing for u = 0. 


With regard to (2) and (3) the first of the functions ~ 


PW) =HY)+9@)FO), Q@) =) + FO) = 


is obviously increasing, the second one is decreasing. 

1 The solution y(x) in question cannot attain for x >a the boundary 

y= +6 of thedomain D (xZa, |y|=8, u arbit- 

rary). For, if aj is the next point where y(a;) = + 7 

(Fig. 1), then, by the monotonity of Q(x), 
(0) = Fin) > Q(a) = LOD) + F¢ a 


whence 


P(x) 
p(x) 


‘ 
a 
LJ 
i] 
1 
\ 


7 


ELLOACDD) 
(a) 
and this is in contradiction to H(u)=0, p(x)>0 
also in the case when y’(a;)—0O. Therefore y(x) cannot attain the value +n, 
still less the value + 0. | 
Equation (1) assures that y aes remains finite, in_ every finite interval 


z, ed 


Fig. 1 


{a, ¢] ‘and even as y" (6, being y ai roa: Therefore the solution yxy may 


be continued for all, =/)d, ee this exists for XA 

Otherwise, the monotonity of..Q(x)~ involves. the Wpundetiness of: iy'| 
Bota x — a,. 100. 

“Now we prove the oscillatory character of p(x). 

See eng. he: case 1 >0. Then: considering (1)°it is ‘clear that at the 
ce x=a y” is eee and remains this as long as y is Doe ee Since 


ae =f. y'dx <0 (x>a), i decreases, its” exaph is concave downware with 


negative slope to the right of a (as long.as: y is positive) and. therefore must 
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cut the x axis at a finite point x,>a (Fig. 2). In this point the derivative 


xy 


of y(x) is y= | y"ax <0. To the right of x, the value y is negative and 


therefore (see (1)) y’ >O (the graph of y is convex downward), moreover y’ 
increases as long as y’ is negative, because y’ (which is <0) is increasing 
and thus /r(y’), too, and again by virtue of 


(1) y”’, increases. Since y art [yas 


y must vanish for a finite value ‘x=4, 
(otherwise y” would be positive and in- 


creasing, fy" ax would surpass |y;| and 

ee y’ would be positive without having been 
zero). Starting at the place x —a,, y == y(a,)<0O we can arrive in the same 
manner at the succeeding zero x, and further at a maximum place a, (where 
y’(a.) =0), etc. Consequently, the oscillatory character for x =a is proved. 
Zeros and only these are the points of inflexions. If 7<0, the proof follows 
exactly the same lines. Let the zeros, the places (>a) of the extrema anc 


Fig. 3 


the corresponding values at these be denoted by x,, a; and y; (i=1, 2, 3,...) 
respectively. Let |y;| be called as “amplitudes” of p(x), the graph of p(x 
belonging to [x:, Xi] as a “half wave”, and that belonging to [x., a] o1 
[a:,Xi41] as a “quarter-wave” (Fig. 3). Being Q(x) decreasing and y’(a)= 
y(a)=0 (é=1,2,3,...), H(O)—0, we have 


F(yi) > F(yin1) whence |yi| > | yes] ((== 1, 24 


what indicates the decrease of the amplitudes;° but these do not approact 


* Similarly, it may readily be seen that all the solutions of (1) have this character 
provided that 6 is large enough compared to ». 

5 If f(y) is like that in footnote *, then the maxima form a decreasing sequenc 
and similarly the minima form another one. 
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zero because owing to the increase of P(x) 
(A) F(n) < p (a1) F(I1) < G(A,)F(I2) <++*< PAu) F(In) <5 


F(9n) > 22 rq) > 2 Fy (L=lim 9). 


p(n) 
COROLLARIES. 
1. At places of equal |y| (not only at zeros) the sequence ay) is 
decreasing. 9 (x) 


2. At places characterized by equal H(y’) 


p(x) 
3. At places of equal y’ the values g(x)F(y) increase. If A(u) is an 
even function, these values corresponding to equal |y’| are increasing too. 


4. At zeros and at places of equal p(x)F(y) of the ascending branchs 
of the curve of y, the values y’ increase. A similar statement is valid for the 
descending branchs. If A(u) is even, |y’| increases at places of equal (x) F(y). 


5. On account of the decrease of Q(x) we obtain 


H(y;) H (ys) Bons 
F(q aac 6h AIPA epee (vi=y' (xi)). 
This is the relation between the amplitudes and the st oe at the neighbour- 
ing zeros. 
6. Being P(x) satan we get (a)F(n)< H(y;)< 9 (a) F(ys) < 
< H(2) < 9 (G2) F(y2) <- 
7. In the case of Much’: theorem A(u)= const 


PW) =F +9)FO) QO=z2Gy+FO) 
and considering the linear equation y’+9(x)y=0O (f(y)=y, A(u) = const) 
P= LF +902, Qy=—2e 


p(x) 
and some of the above formulae will be simplified. 

8. Assumption (x)= k=const >0 is possible too. In this case the 
functions P(x) and Q(x) remain constant, therefore the amplitudes, the va- 
lues H(y’) at zeros and at places of equal y remain constant too, conse- 
quently all the “half-waves” are congruent, finally y(x) is periodic and y' is 
bounded.® If A(u) is even, all the half-waves are symmetrical relative to their 
centres. 


the values |y| decrease. 


> F(y:)> 


6 If f(y) is like that in footnote 2, then the maxima are equal and the minima too, 
but their absolute values may be different. 
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Provided that g(x) =k —const'> 0,,equation (1) .will,be-of.the form 
VERY AWY) AOA Coie > (Ao) 


| H(y) +kKF() = C= KF (a) 
hence denoting the inverse function of H(u) by H"(u) (it is a bivalent 
sce teat Oe 

) AHP KFD=FO)))s 


pial 


and from this 


I ae Pe) =x—a. 
prinsbins "fe H rao Fa) 

is Asciaiiapals ‘the:above: theorem, the 
solution of \this sequation> (the inverse 
function) exists for:allix:2.a: and. itis 
‘periodic. .If h(u) is even,.all the half- 
waves are. symmetrical to their centres. 
Let ‘the inverse of }the function H(u) 


be denoted Mh Ay Mu), for “= 0 and by Hz (a). for us 20 (Fig, 4). Then 


Fig. 4 


“an Ma — meee 

ee Fo” * 2 EERO FOM, 

Similarly | 
fort ter Cy dy 

a NS 

“= | GeaReR SP Th ee Foy SAF) FO 


ye _ The ne of a period is 


| ” ee Q,—a ay 
Oot eens are 


a 


; 
i a ' 


tat 


Let tim 90): te area ite de then: we see that he solittign | of (ei in; ques- 
tion tends to the above ‘periodic function and the distance of two consecutive 
zeros tends: fo Bai (reoneouer decreasing ‘as we shall show. later) as Sobakee °°. 


seé, for cat the equation sian 


aratxeun sed? cotii uly a Vi i til at ty, tl 3 
Tn NY | | deals at aad ie ae 
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eeoHtng the porate fesz, + 2} = and carrying out AR: eae ua 


ees oe eager ee 
I oe 3 Y 303 =x @q aDx=xX); 29 st WY s 
9) “ie hl ee Kesm) ( i) Vy K 


This integral is an elliptic one and its inverse is an elliptic doubly. periodic 
function and the theorem states that one of the periodes is real, etc., and 
we recognize all these’ without the explicit form of the solution. As another 
example we take, the equation 


fi moti Tio best oF sis fe yieajes wit: 34) (k > 0). 


Hence 
S341) tt mt 23 y . : : 36 
du 
oe taint SS eye OS Y= Xi); 
3 ln iad igmot Vlog (1..ka? ku’), : ( va? ) ; 
Mt ae BE ‘ 


34 M522 POMS AW : F iz: E - ; F 
The above statements are valid here too and this is already more interesting 
because otherwise there is very little known about this function. 


_§2 


Take now the general | form of the explicit differential equation of the 
second order 


PDiovoolT .1 Z ni 28 esinaqorqybennf (ayy, wp 
t will be formulated here an oscillation theorem concerning this: 


THEOREM: 22: Lets f(x,y,\u) be: a ciiea for x 2a and for pobre! y and 
u with the following properties: 

1. f(x, y, u) is continuous and sg f(x, y, Ay —=— sgy;: 

2. f(x,y, U), fy (X, VL) ie (fulX5-,,U) 7 exist and are continuous ; 

3. eee aoe y; | 
fiom-. x) pO ustfi he grein | uke 

4. Ks Y, 4) <0 cand feo) y, a ae eae LAZO); 

Ura 1 ent ot 
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5. let f(x,y, u) satisfy the Nagumo condition, i. e. let a continuous pe 
sitive function ®(u) (u = 0) exist satisfying the conditions 


Lfcs,9,u)| = (ul) and | A du + 0 


then there exists for xa a unique solution of (1) satisfying the initial con 
ditions y(a)=7=+0, y’(a)=0 and oscillating an infinite number of time: 


The proof follows exactly the same lines as in § 1. The theorem ¢ 
NAGUMO” assures the existence of the solution for x 2a stating the bound 
edness of y’. (The question arises whether there exist at all function 
f(x, y, u) satisfying 1—5. The function f(x, y, vu) = — @(x)f(y)A(u) of § 1 1 
an example for a function of this kind. Another example is f(x, y,u)= 


= — (x) oe (\y| = 5). The corresponding equation® has an oscillator 
solution etc.) The increase and decrease of y” in the right-hand neighbourhood ¢ 
the zeros x, and x., respectively (see Figures 2—3), are to read off from th 
formula y” =f. +f,y +fyy” in which all the terms of the right member ar 
positive or negative, respectively. It is easy to see, even as in the linea 
case, that the zeros cannot have .a finite limit point. If we restrict y b 
|y| = 6 (6>0), then the graph of y can leave the domain x =a, |y|S. 
attaining the boundary y= —b (supposed 7 >0) and we cannot assert it 
further existence. 


§3 


Theorem 1 may be extended to the equation 


(1) y+ Spo hv)hdy”) =0 


where the functions g;, fi, 4; have the same properties as in § 1. Theorem: 

cannot be applied here immediately without any, hypothesis on the deriva 

bility of the functions g;, fi, Ai. In general, it seems to be impossible t 

find the analogues of the functions P(x) and Q(x). Let the restriction 
h=h=h,=---=h,=h(y’) 

be assumed. Then . 


yy’ n 
77h (Xi =0 
hy) + 2p RO DY 
7 M. Naaumo, Uber die Differentialgleichung y’ =f (x, y, Y), Proc. of the Phys.-matl 


Soc. of Japan (3), 19 (1937), pp. 861—865. 
8 See the discussion of this equation in a forthcoming paper of the author. 
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and with the notations 


Fy) = | fate H(u) = | aay at 
we have . i 


(2) sw) de 1) FQ) _ sl 


whence, making use of Stieltjes integral, 


H(y) +> g(x)Fi(y) => | Fy) d g(x) + > gi(@) Fi(). 
Thus the | function 


PQs) = Hy) + SFO) 


is increasing, and similar conclusions may be made as in § 1. Without fur- 
ther restriction one cannot find the analogue of the function Q(x). If one 
of the functions g;(x), say ¢,(x), is more quickiy increasing, then the other 
g(x) ; 
P(x)’ 


ones, i. e. are decreasing for {= 2,3,...,”, then from (2) 


1 dH(y) , Sox) dFi(y) 


2=\()) 
P1 (x) dx i=1 YP (x) ax 


and so we obtain by integration 


fr ae i=l oA) 


Pi(a) p 
aa ¢1(a) A 


Clearly, the function 


_ AY) . ¥ PO 
20) = a San 


is decreasing. In this case we cannot state the decrease of the amplitudes 
(however, see this problem later), only the decrease of the sequence 


> a F.(y) formed at the amplitudes, etc. 


The equation 
(3) £ (py) + af h(P@y) =0 
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x 


in the form 


—. dx 
may be written by the transformation Sl Pe) 


3) 42 r@r@snn[Z]—0 


where y, ?, g mean y, p, g as functions of €. Since p(x) must have a con- 
stant sign (see the above transformation), p(x) must be positive Ah the op- 
posite case § would be negative for x >a). Being 


d(pq) __ she dx OLN. 
dé “dx @aé& dx y 


Theorem 1 may be applied: 


THEOREM 1’. Let the functions p(x) and q(x) be positive continua 
pq increasing and bounded for x =a, further let f(y) and h(u) be the same 
as in § 1, then the same is true as under conditions of Theorem 1. The inflex- 
ions are not necessarily on the x axis. 


The function P(x)=H(py’)+pqF(y) is increasing and Q(x) = 
_ H(py’) 


Pq 
functions. 


In the linear case 


P(x) — PF 4 gh, Qay— BYE F 


+F(y) is decreasing and the results of § 1 hold concerning these 


Q(x) is the function used in proving the SoNIN—POLyYA theorem. This is 
thus included in the above theorem. 
The equation 


7 (py) + > ao hcnyh(vy) =0 


may be discussed similarly. 


§4 
Let us consider again the equation 
(1) y+ p(x) (y) h(y') =0 
with the premises of §1 and the graph of the solution. obtairied there. 


THEOREM 3. /f h(u) is an even function, then regarding equal values of 
y (equal levels) on a half-wave, the slope |\y'| is greater to the right of the 
maximum (extremum) point than to the left of it. Consequently, the symmet- 
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rical of the left-hand quarter-wave to the ordinate x—= Xp of the extremum 


will lie entirely above the right-hand quarter-wave (Fig.5), hence its area is 
greater too, finally 
a Xin —Xy > Xo— Xin 


‘on Proor. Equation (1) may, be written in the form 


2 | mre lA QUINONE 
oN 


The coordinates and the derivative of the left-hand branch will be denoted 
by x, y and y’, and those of the right-hand branch by &, 7 and 7’, respec- 
tively. Then (2) relates to the left-hand branch and 


3) SOD 2 Gf) 
to the right-hand one. 

~ Integrating (2) as a function of x from x, to Xm and (3) as a function 
of § from § to x,, we have (being H(0)=—0) (Fig. 6) . 


HO) =| eofoyy'dx= | e@fordy  “O’=y'm)) 
and - is 


x, 


H (1) sea p(E)f(n) 1 dé = ) PE)A(ndn (mo '))s 
0 No 


respectively. The variables of the integration of the right sides (i. e. y and 7) 
pass the same interval (yo, ym), but § passes the interval (xm,&) and x the 
interval (Xx), X»).. On account of the | 
monotonity of g(x), there will be on 


the same level 0 = yy) = 1% S Vm %lb------------- 
H (1%) > H(y) 
and, being H(u) an even function, 
inal > [asl ce 


The further conclusion is obvious. 
» > The case of MILNE’s theorem and 
that of the linearity are included too. Fig. 6 
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§5 
THEOREM 4. Holding the premises of the previous § but omitting the 
restriction h(—u)—h(u) it will be proved that a quarter-wave lying before — 
a zero may be brought by a rotation of 180° or —180° around the common 
endpoint quite over the succeeding half-wave, i. e. (Fig. 7) the arc AM’ 
outside of the area bounded by the arc ANB and the part AB of ‘hel x 


axis: ; 
|y(x.—u)| > |y(x%2+u)| (0<u Smin (x»x—Xx, Xs—X2))- 


Fig. 7 


Here xy is the abscissa of the point M, xy is that of the point N. 
Placing the origin in x, (carrying out a linear transformation) the form of 
the equation will not be changed. Let e. g. y(x) be the left-hand half-wave 
under the x axis and let the ordinate of the rotated half-wave be denoted by 
n(x) as a function of x. Then 


n(x) =—y(—x), n(x) =y¥(—x), 1" (X)=—Y"(—) 
whence 

y(x) = —7(—x), ¥'C=1(—x), Y¥X)=—7 (—>). 
Writing these in the equation 
(1) ¥' + ea~)f(yh(y) =0 
we have 
— 1" (—x) + 9X) f(—n(—x)) h(a (—x)) = 0. 
Putting here —x instead of x and taking 
into account that f(—7)——/(n) we obtain 
as an equation satisfied by 7(x) 
(2) n(x) + 9(—x) fm) hr‘) = 0. 
Now it will be proved that on the same 
level (y= 7) 7/>y’ from the level y= —0O 
: up to the level 7 yyy where yy= y(xy) 
Fig. 8 (Fig. 8). Equations (1) and (2) may be 
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ritten, denoting the abscissae by x and &, in the form 


, dH(y 

’) SAO) g(x fy) y’ 
nd 

; dH 
”) HO) — _o(—ageyr, 

spectively. Integrating ai A to the common level y =7 = yy and taking 
ito. consideration that y’(0) = 7/(0)—¥y, we obtain 


Hy) =H) — | p@)F Oy dx =H) — | LO), 


€ y 
H(1!) = H(%)— | o(—®)f (a) n'dé = (9) — | o(—DS an, 


ence 


e y 

H)—Hy) = |e) —9(—D1F0) ay, 
ut 

p(x) >p(—§) (x>m) and f(y)=0, 
erefore H(7’) > H(y), consequently 7 >y’ (being 7’>0, y’>0) up to the 
vel y=yn, i.e. - 

[y(%a—u)|>|yQ2t+u)| (<u smin(x,—Xx, X;—%xX)). 

n this level y’—0, 7’ >0 and 7 is still further increasing up to its maximum; 
us its arc will be over that of y. 

We shall prove, restricting f(y), in §7 that an extremum lying to the 
ft of a zero is farther hereform than the extremum lying to the right of this 
ro, what means: the left-hand. quarter-wave may be brought quite over the 
ght-hand one; its area and “length” are greater. Similar facts will be stated 
yncerning the half-waves too. 


§ 6 
Now we extend one of STuRM’s comparison thearems to the equations 
= V+ e)f(y)h(Y) = 9, 
) nN” + W(x)f(n) h(x’) = 0. 


THEOREM 5. We assume the following conditions: 

1. »(x) and w(x) are positive continuous increasing bounded functions 
[a,b] and p(x) = w(x) but 9(x)==y(x) in any subinterval of [a, 6], fur- 
er p(x)—w(x) = O(x—a), x—a—a+0; 
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2. f(u) € Lip (1), f(u) is increasing’ and sg f(u) = sg uj nifhen ie ~ od 


(u—0), further ——— PDs a 


u<xO0 (eg. fu= yey u); 
3. A(u) >O is an even function non-increasing for u>O, non-decreasing 
for u<0 and h(u) €Lip(1); 
‘4. let y(x) and n(x) be oscillatory solutions of (1) and (2), respectively, anc 
y(a)=0, x(a) =0, y(a)>0, x/(a)>0, y()=0, 
1 (a) y(a)—y'(a) j(a) = 0; Or 


then (Fig. 9) (x) is increas- 


is non-increasing for u $0 and nf aid fo 


f 


Jit 


y(x). 
ing in a<x= “b and assuming 
n(a) = y(a) we have 9798 


NOXD)>V OA) @<xX< Xm, +d 
and 


> ig 
Xm, - Xm, 


where 0 is a certain positive 
number, Xm, and Xm, mean the 
abscissae of the first maximum points of 1(x) and y(x), respectively, succeed- 
ing a, finally 


Fig. 9 


n(x) > y(x) (a<x=b). 
ProoF. It will be dealt with here only the case when 
y(a) = n(a)=0, n'(a) zy'(a)>0. > i 
The general case may be treated in the same way. ie 7 
In the first place it will be shown that in a certain right-hand ‘neigh: 
bourhood of a 7’>y' and so 7>y. Applying the finite Taylor formula we 
have 
yx) = y'(a)(x—a) + 5 "(a+ (x—a)) (x—a)’, 
(0<0, # <1) 
n(x) = 1 (a) (x—a) + 5 0'"(a + 8 (x—a)) (x—al? | 
Being 1/"(x), y’(x) continuous (see (1) and (2)) 
y(x) = y'(a) (x—a) + 0((x—a)’), ON on , . 
MOU Era)+ox—ay),§....K TO Weng Wl) = ya) =O 


and 


n@)—V(2) = Cn} (@) <Q) Gaga) alCeaee)) cared taae- 
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Now we have two cases: 
1. n’(a)>y'(a), thus 7/(x) > y'(x) and n(x) > y(x) for sufficiently small 
s—a> 0; 
2. 7'(a)=y'(a), consequently 
n(x)—y(x) = o((x—a)’) (x +a +0) 
and we get similarly 
n'(x)—y'(x) = o((x—a))_ (x +a +0). 
By virtue of these and 2—3 we obtain - 
I FI) —F(y (&))| S Ki |1)—y(%)| = o((x—a)’, 
|A(7/ (x))— ACY’ (x))| S Ko|n'(x)—y'(x)| = 0(x—a), 
F(n(*)) = f(y) + 0((x—ay’), (x—a+0), 
A(a! (x) = h(y'(x)) + o(x—a), 
Fu CAG (x) =S(V@)) ACY’) + 0(x—a)’) 
being f(y(x)) = O(x—a). Therefore 
1’ (X)— Y"(X) = P)SMA(Y)— POS) AC) = 
= [9 (x)—Y@)IF()A(y’) + 0((x—a)’) (x>a+0) 


but 
f(y) = O(x—a), 9(xX)—Y(x) = O(x—a) — (x +a +0), 
consequently 
n>y", 
hence 
ni >y’, >. for sufficiently small x—a> 0. 
finally 


Ty 
It will easily be found from equations (1) and (2) that 
NII = PSMA N—POSMAGY 


OF 
(a'y—¥’ y= ny (9) LO 49) we) L-neap) 


whence 
3 se) =r'y—y' n= J ny (9) £2 409-9 2 nap) 


Taking 1—3 into consideration we have for sufficiently small x—a>0 (at 
least as long as 7/2 y’ = 0) 

A(x) =n y—ny > 0. 
We state that 7’ >y’ holds up to x= max(X»,, Xm,) +6 at least with some 


7 Acta Mathematica IX/I—2 


98 I. BIHARI 


d>0. In the opposite case there would exist a first place ¢ (a<c< b) where 
V(=yC), nle)>y@)>0 ; 


A(c) = 7 ©) ¥(C)—Y (C)n(©) > 9, 
what is a contradiction, provided that 7/(c)—y'(c) =0. Therefore Xm, > Xm, 
and 7/>y' for a<x<Xn, +6 and ¢>Xm, when. c exists at all. 
See now the sign of A(x). This could be negative only for x >Xn,. 
We state that 4(x) remains non-negative at least up to 6. In the opposite 
case there would be a first place d (Xn,<c<d< b) where 


and 


1 =o. 1/(d)<0, y'(d)<0 


hold but 4(x) = yn (=>) <O in a certain right-hand neighbourhood 


of d. — increases up to d, thus 7(d)>y(d)>0, |7(d)| >|y’(d@)|, conse- 


quently the integrand of (3) is positive at d and in some right-hand neigh- 
bourhood of it. Therefore 


Zz 


A(x) =| +++ [oe =] o> (x >d), 


what is in contradiction to the definition of d. Moreover 4(d)>0. For, if 
A(d)=0, the function 4(x) has a minimum at d where 4’(x) (the integrand 
of (3) at xd) must vanish in contradiction to the above statement. Thus 
the theorem is proved. 

We cannot decide whether or not 7 remains greater than y’ fo! 
a<x=b. Assuming 7’(a)>y'(a) the functions g(x) and w(x) may be iden- 
tical, i.e. a solution of (1) having a greater initial slope remains greater up 


to b, provided that at least one of 4. and h(u) is strictly monotone. 


§7 


Now we can solve the problem of the quarter and half-waves. We 
shall prove the following 


THEOREM 6." All the half-waves of the solution, obtained in § 1, of the 
equation 


(1) V+ P(~)S)A(Y) = 0 


® This is a generalization of a theorem of E. Makai concerning the linear equatior 


y + 9(x)y=0: On a monotonity property of certain Sturm—Liouville functions, Acte 
Math. Acad. Sci. Hung., 3 (1952), pp. 165—172. 
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may be rotated (in the sense of § 5) over the succeeding one (see Fig. 7), 
provided that the premises of § 6 hold, further one of D,(x) and D_q(x) 
is positive at every place x =a (D(x) mean the one-sided derivatives). 


A similar statement is valid concerning the quarter-waves too (without supposing 
that h(u) is even). 


PROOF. As we have seen, placing the common endpoint in the origin, 
the ordinates of the rotated curve satisfy the equation 


(2) 1” + (—x)f(n) h(x’) =O. 
Let e. g. the left-hand half-wave be under the x axis. Now we have 
ni (@)—=¥ (a) >0, (a) —y(@)=0, Tim U2 —1, g(x) > g(—x) (>a) 
and 
9@)—9(—»)=[ aol AO, phe By 
but 


lim pe PO) ia D.@(0) and in eerie D_9(0), 


r>+0 x>+0 


thus g(x)—@(—x) = O(x) (x ++ 0) and Theorem 5 can be applied whereby 
Theorem 6 is proved. 


4G, 


Fig. 10 
Denoting the areas and “lengths” of the successive quarter-waves by 
T; and d; (i=1, 2,3,...), respectively, we have (Fig. 10) 
ig ic 73> =p 
d,>d,>d;>--- (convexity of the zeros). 


Of course, all these are valid in the MILNE’s case and in the linear case, too. 
Simultaneously, the present proof is a new one concerning the decrease of 
the amplitudes too (although making use of more restrictive conditions). 
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§8 
Consider again the equation of §3 


(1) (pyy +af(y)h(py’) =0 fla) 
with the premises assumed there and further let us assume 3 to be as 


in §6 and p(x) a decreasing function. Then the decrease of the area of the 


Ahalf-waves holds. 


AEE & 
Namely, as we have seen in § 3, by the transformation aes equa- 
tion (1) will be of the form 


ae 42 + parayn{ Z| =o. 
The results of §7 concerning y(&) hold, i. e. denoting the zeros of y(&) by 
&,,&,&,... and those of y(x) by x1, X3,Xs,..., the sequence 

ci4t | Tit 

1 
al J x) —— dx fee 12, 3, ak 
J v5) | VOT ( ) 
Py Ti+] 

is decreasing. Omitting the increasing factor sty the sequence J y(x)dx 
(i= 1, 2,3,...) is a fortiori decreasing. ” 


We cannot decide in this way whether over-rotation of the half-waves 
is possible or not, because by the above transformation the distances of the 
zeros increase compared to the corresponding ones of y(&), hence the distan- 
ces in question can be increased too (while the amplitudes remain decreasing). 
Proofs and results of §§ 4—7 may be extended to the equation 


V+ D g(a fiyhily)=0 | 
inclusive the decrease of the amplitudes what we could not prove in § 3. 


SturRm’s theorem can also be formulated and proved. The above Sturm theo- 
rem may otherwise be extended to the equations 


WH OOACW)ACYD=O0 (i=1,2) 
with different g,;, f; and h;, but we do not deal with this. 


§ 9 


The question arises how STURM’s comparison theorem will be formed 
concerning the equation 


(1) (py) +4(x)f(y)A(py’) =0. 
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Holding the premises already often used relative to P, 9, F(u), f “ Stu) , h(u) 


and the initial conditions of § 6 we have for the solutions y, “ib: y2 Of the 
equations 


(PY) +9SWACY)I=0 (=) 
(i= 1,2) 
(but not identically in any interval) the inequalities 
Vi> Ws (a<x=Xm,+ 9), 
Xm = Xm 
" y> 


Vi > Vo (Gx Sd). 
It is more interesting that assuming g,—g,—gq (a unique equation) these 
inequalities hold, provided that y,(a)—y.(a)=0, yi (a) > y;(a)>0 and that 
FY) 
7) 


one of the functions , A(u) is strictly monotone. The proof follows pre- 


vious lines. 


COROLLARIES. Two particular solutions of (1) can have a zero in common 
without having only common zeros (differently from the linear case). 

In fact, y,(a)—y.(a@) and y;(a)=—y,(a) imply y,=y, by virtue of the 
uniqueness of the solution, but y,(@)=—y.(a) and y;(a)>y,(a)>0 result in 
y: >. up to the next zero of y,. Hence two consecutive zeros of y, cannot 
be consecutive zeros of y,. y, cannot twice intersect y, without vanishing 
one or other between these points of intersection. If y is a solution, —y 
is also that. Therefore, comparing the zeros of y, and y,, these functions may 
be assumed of the same sign in the initial part of the interval of the com- 
parison and so the comparison can be carried out. 

In order to compare the solutions of the equations 


(py) +aF WA DY¥)=9 (=1,2) 
one can deduce in the usual way the analogues of the formulae of STURM 
‘and PICONE. These are the following: 


E> (PrYIs— Pad) = la zee o ) n(payy— 4g 22 b¢p. | WY+(P—P)V Is, 
2 


gid E [a __ Pays ] wh 
dx z VW yo 


=|. £2 ne.x)—4, £2 n¢.s9| 2+ —port+ ps [ 22M), 


Yo 


However, kara these re in this form or taking Pi=DPo» 91 = 42 (con- 
sidering one equation with two particular solutions) it will not be obtained 
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new results because the first term of the right-hand member of the Picone 
formula cannot be asserted to be positive when gq, >q, and p, > pr. 


According to Sturm’s theorem we 
can enclose any solution of 


V+ G(x)f(yh(y)=0 
by the solutions of the equations 
yi +(min ¢) f(y) ACW) = 9, 
ys + (max ¢) (2) A(J2) = 0 
with the same initial conditions, i. e. we 
have (Fig. 11) 
W< Ven (a<x=b). 


\ 
\ 
' 
( 
' 
' 
| 
\ 
' 
' 
: 
; 
5 


Fig. 11 


A separability theorem in the sense of Sturm is not valid here. Rather there 
are particular solutions of (1) situated to each other as on the Figures 12. 
The existence of the first and second configurations is obvious. It will be 
shown the existence of the third too. Corollary 5 of § 1 ensures that the 
value of a maximum and the slope on the next zero may be made as small 
as wanted by decreasing the slope at the zero preceding the maximum place. 


Y 


Figad2aly {o.. Fig. 12b 


Fig. 12c 


Corollary 8 of the same § shows that the distance of two consecutive zeros 
tends to zero with this slope, provided that (x) is constant, but also for 
variable g(x) on account of our statement relative to enclosing of a solution 
by solutions of the equations with constant (x). Thus we obtain the inter- 
esting result: given a solution y(x) of (1), then there are also solutions 
having an arbitrary number of zeros between two consecutive zeros of y(x). 
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Application of § 1. On account of the decrease of ” Q(X) = f()" 
-+-F(y), we have 6) 
(yn) < F()9(x:) < LF(). 
This implies" a bound for |y;,| and considering that |y’| assumes its maxi- 
mum at the zeros the mentioned bound of |y,,| is that of |y’| too. The ine- 


quality F(y,) >—— a ) F(n) involves / 
a lower bound for ; Yn|. In the linear oA 
case we have ae 


, Ty g(a) 
1<IulVE, tyel > | 2. 


Let 4 be the distance between the 
zero x, and the next extremum place 
(Fig. 13). Then 


|n|VL4>|yn|4> yn > 2M) in. Fig. 13 
Thus we obtain a lower bound for A and for the distances of the zeros: 
4> MIG) and 21940) I9(@) é 


respectively. E. g., the function x /,(x) satisfies 
¥'+o(x)y =0. 
i 


— —_—7v 


: ; 1 : 
The function g(x)= 1 5 ne is increasing for |v| >a: Denoting a maxi- 


mum place, where already o(x)>0O, by a,, the distances of the zeros of 

x J,(x) and those of J,(x) (which are the same) remain greater than 
Alen pie 2) “=. 

].e. 4>1 and the distances of the zeros are greater than 2. The increase 

of P(x) and decrease of Q(x) imply 


\~ PG) pr, 
F(yi-1) > Fy) > (a) F(y%i-1)- 


9 (ai-) 
i i i= 
he A | g(a) >" 


In the linear case 


10 See the notations in § 1. 
11 Viz. H(u) and F(u) are increasing functions for u >0 and have also increasing 


inverse functions. 
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Application of § 7. Let us denote any solution of the Bessel equation 
WSs 1 y+(1—3)y— 0 
by Z,(x). The function /xZ,(x) satisfying the equation 
a a 


is of character of § 7 for || > 5 and x=0 being ¢’(x)>0. Similarly, the 


y’+(1+ 


1 oe 
function Vxz,(2vx2") for 0< peer x =O (this satisfies y’+x” y—0O) 


2 , 
1—4e¢’r" 
4a°(a—1) 


y= 0| are also of this character. Con- 


and, in general, //xZ,(x*) for a@>1, x>| y and arbitrary v 


—4a°r?+ 4a?x* 
4x? 

cerning /,(x) the decrease of the area of the Aalf-waves holds, provided that 

x20 and v >—1 as R. COOKE” showed. E. MAKAI”™ proved the same for Z,(x), 


[this satisfies alge 


provided that |v|> shy x20, moreover also the same is shown by G. Szec6™ 
3 
for all » but only for x>/2(t— ). 
Of course, for »<0O the lower limit of x is positive in all the above 
cases. The property of the quarter-waves of x Z,(x) etc. cannot be extended 
to Z,(x). 


(Received 2 December 1957) 


1 R. Cooke, A monotonity property of Bessel functions, Journal London Math. Soc., 
12 (1937), pp. 180—185. 

18 Loc. cit. in § 7. 

14 Still unpublished. 


ON A MAXIMUM PROBLEM 


By 
E. MAKAI (Budapest) 
(Presented by P. TurdAn) 


In his book’ P. TuRAN deals among others with the problem of find- 
ing the minimum of the quotient 


max 


aSt=b 


n 
> a,w, 
v—l 


where the a,’s are given and the w,’s are variables and gives -applications 
of his estimates for it. In connection with this, P. TURAN suggested the inves- 
tigation of the following problem the solution of which may be regarded as 
a first step in a chain of extremal problems with further applications in view: 


Let us define the polynomial P(z) by 


[uw (M)= min |w, 1) 


P@=Ha +u:2)—= Dez! (Co= 1, [Cn| = 1, Catt = Cny2==-*>==0) 


where |u;|=1 and let Xb;z' be the formal power series expansion of the 
function [P(z)]'=g(2). Finally, let the function hm(z) be defined by 


hn(z) =(—1)"" [Pe S'o.2| == > aon 2 


What upper and lower bounds may be given for the quantity 
Kun =max | |hn(2)Pd (ze)? 
|uj|S1 6 
In this paper there are given several estimates of the quantity Km», 
the simplest of which is the double inequality (4). 


1. It is easily seen that the coefficients a,, are vanishing if O=k=m 
or k>n-+™m and so 


m+n 


hm (Z) = 2 am bags 


4 P. Turdn, Eine neue Methode in der Analysis und deren Anwendungen (Budapest 
1953). 
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One may verify by induction that 
ho(z) = C12 +0922 + +++ + On2", 


ha( C1 1 ea he B4 a | mee ee 
2)= Sa G vie v4 eA 
eae C3 C Gace te | Ove. 
and generally 

G1 40> Os. 

Coa Cie la 0 

@ 
te toc, 8 (0) 
Rats) = Da : : Wo 
k=m+1 5 E . 
Cm Cm-1 Cm-2 | 
Ce Cra1 Cysaiees! Cecm 


as the upper limit m-+n of the summation can be replaced by o~. 
We argue by induction from m—1 to m. For m=O the assertion is 
trivial. If m==0, then 


hy, (2) = (—1)” Pes ed ob P(2)bn2"| == —hm-1(Z) +(—1)”" P(z) Om 2” = 


C1 1 (@) --- 0 
wo | Co Ci 1 0 © 
(1) =—) |: 2+ (—1)" > bncrz”". 
Cm-1 Cm-2 Cm-3 1 1=0 | 
Ce Cx-1 Cr-2 *°* Cr-m+t 


From Qnm—O it follows that 
Cotes 1 --- 0 


Om = (—1)” pe Cres 1 . 


Cm Cm-1 °*° C1 


Comparing this with (1) we have 


Cy ] 0 Cc} 1 0 
ee os coe? = : fe 
it Cm-1 Cm-2 Ci + Chm Cm-1 Cm-2 l = 
Ce Cr-1  °°* Cr-mit Cm  Cm-1 *°* C1 


Cm Cm-1 Cy 1 
CEM UCR: SCE nt SCL ee 
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2. The coefficients a, are symmetrical functions of the quantities 
Uy, Uz,...,Un, More precisely, symmetrical polynomials of the form 


aa a 
(2) ank = > Om, i; Gy, My, ..., pn Uy‘ Us’, see 
(a5) 


It will be shown that the coefficients d of these polynomials are non-negative 
real numbers. 
It is well known that 


Cy = UW + Ug +++ Un, 
C2 = Uy U2 + Uy, U3 + eee + Un-1Un, 


G, SSL, 
As an analogy of this we define the quantities y; by 

Yi = U1 + Uo+ +++ + Un-1, 

Y2 = U1 U2+ Uy Ug +++ + Uy-2Un-1, 


Yn-1 = WU... Uy-1- 

Furthermore, it will be assumed that 7o 
Cn42 = ++» =0. Now clearly 

C= Yi t+ Uayi-1 (Fae e re), 


1, Yn = Yrs = see ==(), Co = 1, Cai = 


and so 
Ci 1 O aisle @) V1 + Un 1 . O 
& crm 0 Yotuny, Yitun 0 
Cs. to Ch 0 YatUny2 Yoetuny 0 
Amk =| a x : : 
Cm Cm-1 Cm-2 ] Ym t+ UnYm-1 -Ym-1+ Un Ym-2 y 
Ce Cr-1 Ce-2 *°° Chm Yet UnYr-1 Vr-1 FuUnYn-2 29° Yr-m Un Yk-m-1 
1 0 0 +++ 0 0 
—Uy 1 0 0 0 
Cmuy —ith 1 Os Ole 
(—u,)"" (—a,)"* (—u)™ 10 
(—ty)" . (— tte)" (— 4a)" 287 tn I 
V1 1 0 Genk! 
72 7/1 1 0 
73 ie) 7 0 
Ym Ym-1 Ym-2 I 


=i 
Yu—(— Un) Yn-m-1 Vit —(—Un)” Ye-m-1 Pr-2—(—Un)” Yam vee Ye-mt Un Zem-A 
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From this form we can determine the power series expansion Of dmx 
as a function of u,: 


2 m m+1 
Qmk = Ok + Yk -m-1(@m-1, mUn + Om-2, m-1Un + car + aoiUn +Un ) 


where 

WL OU ea 
yn | 0 
pq =|! : 
Yp Yp-1 Yp-2 1 

Ya Ya-1 Yo-2 °°° Ya-p 

The quantities @,, have the same structure as the @n.’s except that they 
are symmetrical functions of not n but only of n—1 arguments, namely of 
the quantities 1, u2,..., Un-r. 

Therefore the assertion of 2 will be proved by induction with respect 
to n by showing that in case n=1 the a,.’s are polynomials or rather mo- 
nomials of the quantity u, with non-negative coefficients. 

Indeed, if n—1, then P(z)—=1-+z and 


Am (2Z) = (—1)" Pas (— n2y—1| = up 2"), 


3. Now we make use of the assumption |u;| = 1 (é=1, 2,..., 2). From 
formula (2) 


| Qmie| = De dnb 95 90 |ur' us". 5 sila | 
a: 
J 


and from this 


|Qmx| = pirdaietos tery One 
(ay 


The upper bound will be reached if e. g. uw, =u,—---—=u,= 1 and so 


2 — Kn 


22 
{ |tn(2)Pd 9 = > Jane? SD | dm mp0, 015-50 
0 k k (a ;) 


with the sign of equality if P(z)=(1+2)”. 
Consequently, the polynomial (1-++z)" and hence every polynomial of 

the form (1+ e'“z)" (@ real) has the property of extremum. 

—n 


4. If P(z)=(1+2)", then g@)=(1+2)"=2| k 


Ja. Denoting by 
H,,(z) the quantity 


corfosr Se 
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one can show again by induction that 


n+m : 
(3) Ha(2) =| . \n frrasontas. 
0 
For, if m=O, it is readily seen that 


H,(2)=(1-+2)'"—1 =af(1+9"a6 
and, if m==0, then using (1) we have 


Hn (2) =— Hin-1(Z) + (—1)” be "\at2y2"— 


—— init (TN ata” 


whence we get by differentiating 


= 
Hal2)—=—Ha(2)+ ("7 Jina p2y" 2" 4 m(12)"2""]. 


Using our inductive assumption we have 


n+m—l Ps f 
Ha(2)=—| sah Jaz" '(+2)" "+ 
rey Satan +m tae =("P") anata 


This is equivalent to formula (3) as from H,,(0)—0O it follows that 
, Ha(2)—= | Hi,(6) db. 
5. Let the quantities A, be defined by 


m+n 


Hn(2)= > Amn2*. 
k=m+1 
By 3 we have 


2n m+n. 
Knn =| |Hn(e®)Pd9—= 270 D) Ann. 
0 k=m+1 
Comparing this with the quantity 
Lun = | |Ha(e®)Pdd = 27 DS) Ans 
0 k=m+1 


it follows that 
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Now ae can be readily determined. Its value is (A) 


2a 


Linn = fre Hy (2)d3 =n" ies i i 2°(1 + zy" (12) dF = 


2 n-> n-1 n-+-m Ab n-1 
—n| 4 "\fatereten d3—=n alt 3 | (2+ 2.08 9)" a9. 


Calculating this last integral we are able to show the validity of the double 
inequality 


Ke pee « 
(mn) ee ge (22=3) (2n—5)... a (m-+1/ 
Sin (2n—2)(2n—4).. a 2 


and from this the simpler but less sharp inequalities 


,(m+tna—1\; 1 ,(m+ny a 
(4) "| m ). py ae Km <8 (MT a) 
6. The quotient Kin»/Ln, fulfils the sharper inequalities 
1 K, 1 1 1 
5 - = mn = : 
(5) ales aay | 


[m+ aly je 


too. This can be seen if we write KX, in its explicit form 


‘m-+-n\ oso (a2—l 1 
Ke 20 Ai (TST) eee 


n—!] Aa—l 
From the equality E k J=(7 0 and from the convexity of the func- 


tion x it follows that 


(me Ey (T8307 lary 


= 3 aaa tale 7}: 


m+n 2 n-1 r= 2 
Ln == 220 n Jn S| iy 


the last double inequality is equivalent to (5). 


Since 


(Received 12 December 1957) 


ON THE STRUCTURE OF SET-MAPPINGS 


By 
P. ERDOS (Budapest), corresponding member of the Academy, and A. HAJNAL (Budapest) 


1, Introduction. Let S be a set and f(x) a function which makes 
correspond to every x€S a subset f(x) of S so that x¢f(x). Such a function 
f(x) we shall call a set-mapping defined on S. 

A subset S’Cy¥ is called free (or independent) with respect to the 
set-mapping f(x), if for every x€S’ and y€S’, x f(y) and y¢ f(x). 

Let S=m=y, and n<m. Assume that f(x)<n for- every x€S. 
RUZIEWICZ raised the problem if there always exists a free set of power m. 
Assuming the generalized hypothesis of the continuum the answer to the 
problem of RUZIEWICZ is positive.’ 

In our present paper we are going to define more general set-mappings 
and raise analogous questions to those of RuziEwicz. Let there be given the 
set S and a set of ss subsets /. Assume that the function f(X) makes 
correspond to every set X of / a subset f(X) of S so that the intersection of 
f(X) and X is empty. f(X) will be defined as a set-mapping of S of type 
I. This is clearly a generalization of the original concept of the set-mapping. 
(There / consisted of all the subsets of S having one element.) The subset 
S’SS is called free (with respect to this set-mapping, or briefly a free 
set of the set-mapping) if for every XCS’(X€/J) the intersection of f(X) 
and S’ is empty. 

Our aim is the investigation of those set-mappings where / consists 
either of all subsets of S of a given cardinal ¢ or of all subsets of less than 
a given cardinal ¢. In these cases we shall briefly say that the set-mapping 
is of type ¢ or of type <t¢, respectively. If f(X)<n for all X of / we shall 
say that the set-mapping is of order nm. Our problems will be of the 
following kind: Let S—~m, further let f(X) be a set-mapping of S of order 
n and type ¢. Does there then always exist an independent set of power p? 


2. Definitions and notations. In what follows capital letters will 
denote sets; x,y,2,... are the elements of the sets; greek letters denote 
ordinals; a,6,c,m,n,t,p denote cardinals and k,l,s,... denote integers. 


1 For the history and older results on this problem see [1], for the more recent 
results and ramifications see [2]. 
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Union of sets will be denoted by + and 5%, intersection of sets by - and JI. 
+ will also be used to denote addition of ordinals, — will be used to 
define taking relative complements. x€A denotes that x is an element of 
A, ACB denotes that the set A is contained in B (ACB denotes that A is 
a proper subset of B). ma will denote the initial number of Na (w, =). 
a* will denote the cardinal Nai: where a—N.z. If £2 is the initial number of 
a, then §2+ is the initial number of at. 
The cardinal numbers 6,,, are defined by induction as follows: 
b.0=2, Orn = 2", = 

The initial number of 6,,, will be denoted by $2,,x. 

The proof of some of our theorems makes use of the generalized 
continuum hypothesis. These theorems will be denoted by (+). 

In the proof of some of our theorems, wich will be denoted by (+), 
we make use of the following hypothesis: a 

Let m be a strongly inaccessible cardinal number, S=m. Then one 
can define a two-valued measure «(X) on all subsets of S for which 
u(S)=1; «({x})=0 for all x€S and the measure is additive for less than 
m summands. In the present paper we do not investigate the problem, if 
these theorems are equivalent to the above hypothesis. 

Let g(x) be an arbitrary property of the elements of the set H. The set 
of all x€H which satisfy (x) will be denoted by {x:@(x)}. The notation 
{ } will also be used to denote sets whose elements are those which are 
contained in the brackets { }. The set {X:XOS; X=t} will be denoted by 
{S]' and the set {X:XCS;S<t} by [S]*". 

For the study of the set-mappings we introduce the notations (m,n, t)— p 
and (m,n, <t)—+p to denote that every set-mapping, defined on S (S=™m), 
of order n and type ¢ (or <¢, respectively) has a free set of power p. In 
the opposite case we write (m,n, t)—{+p and (m,n, <t)-+-p, respectively. 


3. A short summary of the principal results and problems. As a 
first step we show that if the type ¢ of the set-mapping is infinite, one can 
never assure the existence of a (non-trivial) free set, even if the order of the 
set-mapping is 2, in other words we shall show that for every m and t=, 
(m, 2,t)—++t. (From this it is easy to deduce that (m, 2, < ft), for t> & 
(see Theorem 1).) 

Thus we can expect positive results only for (m,n,k)—p and 
(m,n, < Xo) — p, for simplicity we write (m, n, w) — p instead of (m, n, < N.)—p. 

For the symbol (m,n, @)—p we obtain the following negative result: 
Let m< Naz, then (m, 2,m)—+®, (see Theorem 2). 


2 See [3] and [4]. 
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Then we prove the following surprising result: («*x) Let m be strongly 
inaccessible and n<m, then (m,n, w)—m (see Theorem fay 
The simplest unsolved problem here is the following: 


PROBLEM 1. (Nu, 2, @) > &,? 
(It is easy to see that (Nz, 2, @)—++N,, this easily follows from 
(m, 2, @) ++, for m<X.). 


The problem of the set-mappings of type « is closely connected with 
a problem considered by ERD6s—RabDo: 

Can one split for each k (1=k<,) the subsets of k elements of S 
into two classes so that if S,SS (S,=N,) is an arbitrary infinite subset of 
S, then there always exists a k such that S, has a subset of & elements in 
both classes ?* 

By the methods used in this paper we prove that if m is less than 
the first strongly inaccessible cardinal m),m)> No, such a splitting is possible, 
but if m is strongly inaccessible, m>N,, then there always exists an 
S:SS, S,=m, such that for every k (1 =k<X,) all subsets of S, having k 
elements are in the same class (here we have to use (##)). (See Theorem 9.) 
By the symbolism introduced in [6] these results can be expressed in the 
form : 

m—+(N.) ™® if m is less than the first strongly inaccessible cardinal 
My) > XN, and 

m +(m)~*° if m is a strongly inaccessible cardinal, m >). 

For the set-mappings of finite type our results are more complete. 

For the set-mappings of type 1 we already stated that (*) (m,n, 1)—m 
for n<m and m=. 

For strongly inaccessible cardinals m we have (m,n,w)—m (**) and 
- consequently (m,n, k)—+m (n<m) for every k too. 

If m=N., where @ is a limit number (but we assume that Na is not 
inaccessible), we can prove, using (*), that (m,n, k)—>m (n<m) (see Theo- 
rem 8). 

Thus in these cases the exact analogue of the results of RUZIEwIcz for 
k=1 holds. 

If m=Nas, the analogue of the conjecture of Ruziewicz fails already 
for K=2, i.e. we shall show that (Na+x-1, Na, k)-'+k+1 for k=1,2,... (see 


Lemma 2). 
On the other hand, we can prove that (*) (Naix,Na,k)—+Naii (see 


Theorem 3). 


3 See [5]. 


8 Acta Mathematica IX/1—2 
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Thus we know that the smallest m, for which the symbols (m, Na, k)— 
+N), ..., (Mm, Na, kK) > Nasi are true, is Nex, but, on the other hand, we do not 
know the greatest p for which (Na:x, Na, k)— p is true. We can prove only 
the following negative result: (*) (Naz, Na,k)4>Naix if K22 (see Theo- 
rem. 5). 

So the simplest unsolved problem here is the following: 


PROBLEM 2. (N3, No, 3) > No? 

((Ns, No, 3) +N, is true and (N;, No, 3)—+N; is false.) 

For the set-mappings of finite order we have the following results : 

If m is infinite, then (m,/+1,k)—®, (see Theorem 10) and 
(*) (Nask-1,/-+1,k) Na for K=1,2,...; /=1,2,... (see Theorem 11). 

We have no negative results corresponding to the result of Lemma 2, 
but we know that (*). (Na+, 2,2) Nasi (see Theorem 5). 

The simplest unsolved problem here is the following : 


PROBLEM 3. (No, 2,3)—> 1? 

((N2, 2,3) +N is true, (N2, 2,3)—N; is false.) 

We investigate separately the set-mappings defined on a finite set S. 
We have the following result: If p, m, / and k are integers and p(m, l, k) 
denotes the greatest integer p for eras (m,1+1, Kise p is true, then 


k+l 
cm < p(m, I, Deen rts 
where the positive real numbers c, and c, depend on & and 1. 
The following problem arises: 


PROBLEM 4. What is the exact order of magnitude of p(m, l, k) ? 


4. Proof of the results. We enumerate some simple properties of 
our symbols: 

If m<m' and (m,n,t)—>p, then (mjn,t)— p. 

If n<n’ and (m,n,t)—p, then (m,n,t)—p. 

If p<p’ and (m,n,t)—p’, then (m,n, t)—>p. 

Similar theorems are true for the symbol (m,n, <t)—>p on we also 
have 

(m,n,t)—>p and (m,n,<t)h>+p if t<t and (ma, <t)—p. 

In what follows we shall use these theorems without references. 


LemMA 1. Let S be a set, S=t=Q,. There exists .a- function g(X) 
cals on the set [S]' which satisfies the following conditions : 


(1) (X)CX, (2) e(X)=t, (3) e(X)+a(Y) if XY. 


This construction is due to J. Novak. 
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PROOF. First we prove the existence of such a function in the case S = ¢. 


Then [S]'=2'. Let 2 denote briefly the initial number of 2', and let 
{X,},<o@ be a well-ordering of [S]‘ of type 2. We define the function 2(X,) 
by transfinite induction as follows: Let g(X,) be an arbitrary proper subset 
of power ¢ of X,. Suppose that g(X,) is already defined for all « <v where 
vy <Q. Then {g(X,)}ucy =7 <2! and, on the other hand, [X,]'=2! Thus 
there exist proper subsets of power ¢ of X, different from all g(X,) for all 
“<v. Let g(X,) be such a subset of X, with the smallest subscript. Thus 
g(X,) is defined for all » < §2 and it is obvious that conditions (1), (2) and 
(3) hold. 

Now let us consider the case S >t. Let M be a maximal subset of [S]* 
such that X = for every X€M and X-Y <t if X,Y are two distinct elements of M. 
(The existence of such an M is assured by ZoRN’s lemma.) Let {Ya}a—,. be a well- 
ordering of M. Since Y2—t for every @<7t, we already know that there 
exist functions ga(X) defined on the set [Y.]' satisfying the conditions (1), 
(2) and (3). By the definition of M there exists an @ (¢<T), for every 
X€[S]*, for which X-Y,—t. Let @(X) denote the smallest @ for which 
KY == ti: 

We define g(X) as follows: 

&(X) = Ba (x)(X- Ya cx)) + (X— Yaa). 

From the properties of the functions g.(X) it follows immediately that 
2(X) satisfies the conditions (1) and (2). 

We have only to prove 2(X,)=-g(X,) for X,== X, where X,, X, € [S]*. 
We distinguish two cases: (i) #(X;) = «@(X2) =a, (ii) ¢(X%) + @« (X). 

(i) Then either X,-Ya== X.-Ya or X;:—Ya==X.—Ya and _ therefore 
either La(X1- Ya) = £a(X2° ¥3) orix, — Yo += X— Y., hence &(X,) + g(X). 

(il) We may Toys a(X,) < @(X,). Then, by the definition of a(X), 


g(Xi): 1): Yax) =t and . 2%) Ve Yax,) <t, 


hence g(X,) + g(X,). Q. e. d. 

REMARK. In case S>t, we can prove with a slight modification of the 
construction the existence of a function g,(X) defined on the set [S]’ satisfying 
the conditions (1), (2), (3) and the following condition too: 

(4) For every Y€[S]* there is an X €[S]‘ for which Y=g,(X).° 

We can not solve the following ‘problem: 

PROBLEM 5. Let S bea set, S>t2N>. Does there exist a function 
gh(X) defined on the set [S]' satisfying the conditions (2), (3), (4) and the 
following stronger condition (1’) instead of (1): | 


5 See Erpés—Fopor—Hajnat’s forthcoming paper. 


st 
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(1') For all X€{S]}' g(X)GX and X—g(X)=t? 
THEOREM 1. (m, 2,t)-i+t if T2N 3 (m,2,<t)-+>N Ff t>No- 
We shall only prove the first statement; the second is a consequence of it. 


Proor. Let S be a set, S=m=t. We define a set-mapping /f(X) of 
S of type f and order 2, having no free sets of power f. Let g(X) be a 
function defined on the set [S]' satisfying the conditions (1), (2), (3) of 
Lemma 1. We define the set-mapping f(X) as follows: Let X be an arbit- 
rary element of [S]'. If there is a YE[S]* for which X=g(Y), then by con- 
dition (3) ‘this Y is uniquely determined and by (1) the set Y—X is not 
empty. In this case we choose an element x of Y—X and we put f(X)= {x}. 
In the other case we put f(X)—0O. It is obvious that f(X) is a set-mapping 
of S of type ¢ and order 2. 

If X, is an arbitrary element of [S]', then by (1) and (2) we have 
B(X)EX, F(X) €[S]'- 

By the definition of f(X), f(g(X))-X = {x} + 0. It follows that X, is 
not free. Q.e. d. 

We need the following lemma: 


LEMMA 2. (Naiz-1,Ne,K) +> K+1; (Narc, Ne, kK) > k+1 (K=—1,2,...5. 
Lemma 2 is another form of a theorem of KURATOWSKI—SIERPINSKI 
proved in [7]. Therefore we omit the proof of it.* 


The proof of KURATOWSKI shows that the first part of Lemma 2 is true 
in the following stronger form too: 


Let S be a set of power Nasx-1 and {Xy}y<0,,,-, @ well-ordering of S§ 
of type Wasx-1. One can define a set-mapping f(X) of S of type k and order 
N., having no free sets of power k+-1 and satisfying the following condi- 
tion: (1) For every {Xy,,...,X»,} €[S}*, xy €f({xX,,,..-,X>,}) implies that 
axe Max (1, Sear Vy). 

THEOREM 2. (m,2,@)—-++No if m<Nzo. 


Proor.’ Let S be a set of power N, (K=1,2,...); {x,},. o, a well- 
ordering of S and f(X) a set-mapping of S of type & and order X&, satis- 
fying the first part of Lemma 2. 


® The equivalence of Lemma 2 and of Kuratovski’s paper [7] may be seen by using 
the following idea. The splitting of Z”*! in [7] induces a set-mapping f(x,,...,X,) as 
n+1 
follows: f(x,,...,X,)= ae Dag POR tether 4: 
Gy, tf) Real 
runs over all permutations of the numbers 1,..., 2. 


™ The idea of this proof for the case k=O is due to J. SurAnyt. 


Wel +109 % JE A,,}, where (i,,...,4, 
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We define a set-mapping g(X) of S of type w and order 2 as follows: 

Let X be an arbitrary element of [S]~*° and {f,(X)}icw a well- -ordering 
of type w of the set f(X). We have two cases: a) X has at most k elements. 
Then we put g(X)=0. b) X has more than k elements. Then X has the 
BMAX), LyX, Xv, ys Xm} (<9; fori </). 

Let g(X) = {fil{xs,, ..., X»,})}. 

Since g(X)-X= 0, by condition (1) of Lemma 2, g(X) is a set-map- 
ping. It is obvious that g(X) is of type w and order 2. We have only to 
prove that g(X) has no infinite free sets. 

Let Y be an arbitrary infinite subset of S. Then there is a subset 
{Xr,},<. Of Y such that v.,<¥,, for s,<s,. The set-mapping f(X) has no free 
sets of K+ 1 elements. Therefore there isan i (0=i=k) and an 1<wm such 
that 

Ke PU (Xv hee +5 Xvi) 1p Xopgqyeety Xyy})> 


Berane Genoredtne Set 4X5, ....Xy; 4) %Xvp.17-++4%4,4- Len Xoe{[S]— Aoc ¥. 
and by b) g(Xo) = {x,,}. Thus g(Xo)- Y= {x,,}=+=-0; hence Y is not free. 
Q.e. d. 

LEMMA 3. /f [S]**! = eh and S§> by,,%, then there exists a subset 


So of S and a %<@ae el that [Sk , and Sy) = Neu (k=0, 1, 2,. ay ie 


ProoF. Without loss of generality we may assume that the sets /, are 
mutually exclusive. 

We prove the theorem by induction on k. In the case k=O the theorem 
is obviously true. Suppose now that it is true for a certain k and let S be 
a set satisfying the following conditions : 

() S> Peep, Sods ae D> bes (OY Iyly =O for =F. 

Let xo,...,X, be k-+1 arbitrary elements of S. We split the set 
S—{xo,..-,Xx} into classes. The elements x and y belong to the same 
class if and only if there is a »<@q such that {X,Xoyee., Xep € ly\-and 
{y, Xo, .--, Xx} € ly. It follows from the conditions (’’) and (’”) that this really 
defines a splitting of the set S—{xo,...,xx} into classes. Let Qs, denote 
these different classes where 4; runs through the ordinals less than wa. We 
select an element xs, from each of the non-empty classes. 

Suppose that we have already defined the classes Qp,...s, and the ele- 
ments Xg,..6, for «<4. Let {8,}u<, be a sequence of type 4 ‘of these ordi- 


8 This theorem is proved in [6]. By the symbolism introduced there the theorem 
can be expressed in the form: If m > by x then m> (®. ee ¢ 
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nals. Let us consider the classes 
L1Qe, : Bu i. {Xo, oS es Xk. Xp, “ee i Td {Bu}u<a* 
b< 


We split these classes into subclasses as follows: The elements 
xy Of Qisy,-, are in the same class if and only if for an arbitrary 
AE [{X0, - «+, Xk, Xp... Gbucal**? there exists a »<@q such that the sets 
{x}-+ A, {y}-++A belong to the same class /,. It follows from the conditions (’’) 
and (”’) that this really defines a splitting of the class Qj), into sub- 
classes. Let Qag, ...4,..., denote the classes thus obtained where & runs over 
the ordinals less than a certain initial number. We select an element Xg,...a, 
from the non-empty classes Qs,...,. 

We shall prove that there is a sequence {f},-ox, , for which the ele- 
ments xg,...s, are really defined. First of all we prove that @ < $2x,, x41 for every 
4 < Qy,,. and for every sequence {8,},-,, i.e. at every step in our process 
the power of the set of all non-empty subclasses of the class Tepe Pee 
is at most D+,x4:. Namely, we can obtain these classes as follows: First 
we ‘split the set Qfs,...6,..},-, corresponding to an- element A of 
[{X0,.--, Xk, XB)... Gutucal**! into Na classes and then. we say that x and y 
belong to the same class if they belong to the same class for all A. On the 
other hand, 4=by,,x and so [{X0,..., Xx, Xp... Bybycal’*? SOx,,x- Thus the 
power of the set of all non-empty subclasses of Qis,3,, <x is at most 


b b 
Roark oa Nak 2S. 
ee 20 ee OL i. 


Let A, denote the set of all sequences {@,},<,. By the result just 
proved we have 


A, < be be chic’ OD Re teak =f i M 
Aj — Oy sett = 0 fen — 2 a,k a,k= by, k4+1 if yt < Qy,, k- 


Let S, denote the set >) {X0,..., Xe» XQ,...8,} <q: Hf A < Qe,» then 
_ a {Pu}u<a © An 
Si = And S by, ut1- 
It is obvious from the construction _ that S= Sox Rs 
(LE Qu.:.0,) and Sop ,—= D>. Si. 
{B, heat € “ot p< ORK 7 AKON sk 
Therefore Sot p= Pax ON b+ S Og, c+. It follows by condition (’). 


that there is a sequence {Brjrcoe for which I Qs, ... 6, is non-empty. Thus 
Ff A<Qy sk 

Qs)... 6, iS non-empty and therefore xp,..., is reaily defined. It is obvious 

from the construction that if 41--ds, then xp,...¢, -- Xp, ws Bay 
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For the sake of brevity let xxi, denote Xp, ¢,- Then for the set 
Si = {xihrcox , we get Seba y. Exige es Xe aS an acinrist: subset of 
k+1 elements of the set S;, then by the construction there is exactly one 
¥ <@a Such that {x,,,...,Xa,, X}€/, for every 4> Max(do,..., 4). In this case 
we say that {X0,..., Xa, isan element of J;. It is obvious that [S,]**!—= 2, If 


and /,,-/;,—=0 for 7 == 92. Thus by the induction hypothesis there is a set 
SoS Si and a % <q such that [So]! CJ, and Sp = Nat. 

BULFIMXi ys eee thy, toe =* Usaibn)s is an arbitrary subset of k+2 
elements of the set So, then{xrq, -++, Xa,} €/,, and therefore {x,, ,... Kaha eles 
i. e. [So]? /,,. Thus we have finished the induction, and Lemma 3 is 
proved. Q.e.d. 

LemMA 4. Let S be a set, S=m=, (n<m) and f(X) a set-mapping 
of S of type 1 and order n. The set S is the sum of at most n free sets. 

Lemma 4 is a theorem of G. Fopor.’ 


(*#) THEOREM 3. (Naix, Ne» kK) Nout (K=1,2,...). 

Proor. Let S be a set, S=Naix and f(X) a set-mapping of S of type 
k and order Na. We have to prove the existence of a free set of power 
N..:. For k—=1 the theorem is well known. We shall suppose k> 1. 

F({x1,..., Xx}) will’ be denoted briefly by f(2%1,..., x). Let {x1, ..., Xx-1} 
be an arbitrary element of [S]*-’. We define the set-mapping g,,,..., <, ,(X) 
of the set S—{x,,...,x,-1} of type 1 and order N. as follows: 

Por every a) XE S— 1X1, 027, Xe-1)) Ot Dn ey, (4X}) I Oly eo Xbada X)- 
By Lemma 4 S—{x1,...,Xx-1}= Pe z,., for every x1,...,Xx-1, where 


the Nsets 9S 7) Meee, “are free sets of “the set-mapping Ride _ ,_,(X) for every 
¥<@a. We may suppose that Sri. 2, .°Sx..2,.=0 for Marinas Let 
{Xp}u<o,,, be a well-ordering of S of type @asx. Let {Xp),...,Xub (U1<se+< Ux) 
be an arbitrary subset of & elements of the set S. We split the set (s} into 
subsets Iv,...1,, where the symbol (71...7%) used as subscript consists of k 
ordinals less than oo. {Xu,,---,Xu,}€lo,..%,) if and only if Xu; € 


os, for every i (1=i<k). Obviously 


tan See oe Tuy 


7 los... %). 
Si pa pac tase 


(171 ME) (V4 < OQ? tal, J; so 
The set of the symbols (7...7%) is of power Na and by (*) Sei ote: Rex 
thus by Lemma 3 there is a subset So and a symbol (v1... Vz) such that 
[So]! S Lots. vy) and So = Nai- 


9 See [8], Theorem 1. 
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The set So is free. It is sufficient to prove that if {x,,,-. sy Xupy 
(uo < +++ <x) is an arbitrary subset of k+1 elements of the set So, then 
Xing EF (Xpeyice® “a Xepg rose raat) se ne ee 

In fact, for example, in the cases i=-0 we have {Xpo,--+5 Xpj_y>Xujyy reer Xu hE 
cl 0... +2) and {Xia site Kime ecueiice eae €1(,0._. 49) and therefore 

Vy Vy } 


tt} 
Xen pine Spin apleawtartieg har consequently Xu; Er. 24; o 7:44 ({x,,-,}) = 
eae X paler spXn ges p.Xmedt on amend 

We have similarly in. the case i—O that Xu Ezy, -- Zap ({Xu}) = 
=f (Xu,,--++,Xn,). Thus we have proved that there is a free set So of power 
Nava > Q. e. d. , 

(*) THEOREM 4. The smallest m for which the symbols (m,Na,k)— Np 
(0=@Sca+1) are true is Nas. 

Theorem 4 is an immediate consequence of Theorem 3 and Lemma 2. 

(*) THEOREM 5. (Nasz, Na, Kt Narr Uf kK = 2; (Neri, 2, 2) > Neu. 

We shall only prove the second statement, the first is a consequence 
of it. We have stated the first one explicitly, to make Problem 2 clear. 

Proor. Let S be a set, S=Na-1. We define a set-mapping of S of 
type and order 2 which has no free set of power Na+i1. Using (*), we have 
Sips Ni Nat. Let {Xr}r<w,,, and {Xr},<o,,, be well-orderings of 
type We, of the sets S and [S]€e, respectively. We define the sets S,—= 
= {x,}ucyand[S]}* = {X,:X,ES,; «<v.} Then S, =, and (S}8*=N. for 
every ¥ < Way. Let {Xi}icw, and {Xr }icw, be well-orderings of type wa of 
the sets S, and [S],*, respectively. We can choose a sequence {Tc}c<w, 
(To, < To, if 6: <2) in such a manner that x;,€X;. This sequence may be 
defined by induction. Suppose that we have already defined x:,, for every 
o’ <o, then the set {x;.}.<¢ has a power less than Na and the set X,, being 
an element of [S]°*, has an element xy different from all xt, (o’ <a). Let to 
be the smallest + for which x7€ Xz and xV€ {xi }or<e. 

We define the function g(x,,x,) for «<< q@ai1 aS follows: We define — 
2(x:,Xy) for every fixed »< ay: and for all t<q@e. If t is an element of 
the set {To}o—w,, we put g(xr, Xy) =X, where jo denotes the smallest ordinal 
number « for which x, € Xe (t =o, Xw=EXy, Xu + x1,) and put g(x?, x») = Xo 
in the other cases. 

Thus we have defined g(x,, x,) for every «™<¥< Way. We define the 
set-mapping f(X) of the set S of type and order 2 as follows: 

If {Xu,X»}(u<¥) is an arbitrary element of [S]}?, we put f({x,, x,}) = 
ee {2(%u, Xy)}. 
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We have to prove that there is no free set of power Nai. Let So be an 
irhitrary subset of power Nai: of S and S$ a subset of So such that SJ —N. 
Then there is a v<@qei; for which S{§—X, and a %>v such that 
X, €[S]i* and x,,€So. Then, by the construction of the function g(x,,x,), 
here exists a uo <¥% for which Xuo€Xy and g(Xp,,X»,)€ Xv. This means 
hat {Xu,,%,} So and F(Xng1 Xvot) So = {2 ({Xu,. Xvoh)} SEO, consequently 
he set So is not free. Q.e. d. 

(*) THEOREM 6. /f @ is an ordinal number of the second kind and Na 
s not inaccessible, then (Na,Ns,k)—Na for every B<a (k=1,2,...). 

PRooF. We prove the theorem by induction on k. For k=1 the 
heorem is well known.” 


We shall now prove the theorem for k=2. Our proof shows clearly 
1ow induction works in the general case. 

Let S be a set of power N., f(X) a set-mapping of S of type 2 and 
yrder Nz. Let t be the smallest ordinal number for which N.= > Nz, 


Bu < Py<@ if w<v). By the assumption of the theorem t < Na. Since 6<a, 
ve may suppose that 6+2<(, for every v<tT. 


We define X,, as the sum > Ns, We may also suppose _ that 
Ss, = Ny, +3 and that every #, is of the form y-+s where s 23. . 

By Theorem 3 every subset of power Na of the set S contains a free 
ubset of power Ng. So we may select a sequence {S,},<, of the subsets 
f S which satisfies the following conditions: 

(1) S,=Nz,; (2) S, is a free set; (3) S,,-S,.=0 if =». 


Put F,—= > S,. By (1) and (3) F,=N),. Thus [F.2=Ny,, conse- 
u<v 


juently eel (X) = Ny, -Ns—Ny,<Nze,. Therefore we may suppose that 
xelF,P 
4) J(X)-S, =0, if. X€{FP. « 


Let S° denote the set Ors: If X€[S]?, then X= {x,y}. In what 


ollows f(X)-S° will be denoted by fi(x, y). Suppose now that x,y € S,. Then 
(x, y)-S.=0 for u>v by (4) and for w=» by (2). Thus fi(x, y) SF, and 
ince fi (x, y) < Nz, A y) € [Fy 

We split the set [S,]? into classes. The sets {x1, yi} and {x2, yo} belong 
0° the same class if and only “if fi(x1, 1) =fi(x2, yz). Using (*), we have 
Fy) <*6 = NX! = Ny 41 =Ne,-2. Thus, by Lemma 3, there is an S,CS, 


10 See e. g. [1]. 
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(Se = Np,,-1) such that for every x, yeS, fi(x, y) is the same subset of F,. 
We define S! as follows: S,—S,— >  Aflx,y). It is obvious that 
uy, fr, y¥ CS, 
of Me fy) st Ne = Na,-2 < No, -1 | 
u>Y, {z, y} oS, 
and therefere we have 
(5) Sy Nz,-1- 3 
Let S' be the set >'S}. By the construction of S, we have 


(6) fix y)S'=0 if x,y€S} for every v<t. 
Let F) be the set >'S:. We define the set-mapping g,({y}) of the set 
uv 


Si of type 1 as follows: For every element y of S; let g,({y})= 
#5 Pa Fi(x, y)-Sy. 


2eF, 


We have 


& fils 9) S Fe Rp = Ny, p= My, 
zeF, 


Thus the order of the set-mapping g,({y}) is less than N,,-1. By the case 
k=1 of Theorem 3 there is an S/CS, (SY=N;,-1) such that S? is a 


free set of &r({¥})- 
Let S* be the set > S; and F; the set 2 Se We have by the 


vet 


construction of S? 


(7) Ss; = Np,-1- 
From (6) we have 
(8) K(x, y):S? —0 if x,yéS> for every. % <7, 


and from (4), by the construction of S>, we get 
(9) fAi(x,y) > Si=0 if x€F2 and yeF2 or yeS?. 
w= 


Put f,(x, ¥) =fi(x, y)-S?. 

If x€ Fy and y€S>, then, by (9), fo(x, y)SF;. We split the set S> 
into classes as follows: y and z belong to the same class if and only if 
2(x, Y) = f2(x, 2) for every x€ Fe: 

We can obtain these classes as follows: First we split S: into classes, 
corresponding to every x0 €F;, so. that y and z belong to the same class 
if J2(%0, Y) = f2(%o0, 2) for this xo and thus we obtain at most [F;, [ey <= 
=N}P = N41 classes, since fo(x, yy€ [Fo]<**. yy. and z belong to the same 
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class if they belong to the same class for all xo. Therefore we have split the 
set S; into at most xr =N,,+1 Classes, consequently, by (7), there is a subset 


S; of power Ne, -1 of S; whose all elements belong to the same class. It 
follows that 7 . 


(10) Se =Ne,-1 
Let S* be the set >’ S? and F; the set >’ S?. If 
Vt py | 
(11) KOE, ey ZES., 


then, by the construction of Sy, fi(x, y)=f,(x, 2). Further, by (8), 
(12) f(x, y):S°>=0 for x, yeS:. 


We define the set-mapping go({x}) of the set S° of type 1 as follows: 

For every x€S there is exactly one »<t for which x€S?. Put 
go({x)}= > f(x, y)-S® for all x€S* where y is the ordinal number 

u>T, yes, 
for which x € S>. It follows from (11) that go({x}) S T-Np < Na. 

The set S* has the power Na. This is true because by (3) the sets S; 
are mutually exclusive and by (10) = =WNz,-1- Thus, by the induction hypo- 
thesis, i.e. by the case k—1 of our theorem which is already proved, there 
is a free set S* of 2({x}) such that S*CS*® and S*—N.z. Let S% be the set 


S*.S?. Then S*= >) Si. If x,y €S‘, then there is a u and y such that x € S; 


vet 

and y€S}. We may suppose that « = v. Obviously, f({x, y})- St= — f(x, y)-S* 
and, by (12), fo(x, y):S4‘=0O if w=v. Further fo(x, y)S&go({x}) if w<-. 
Therefore /2(x, y)-S+=0O in this case too, since S* is a free set of go({x}). 
Thus S‘ is a free set of power Na of the set-mapping f(x). Q.e.d. 

In the proof of Theorem 6 we have made use of the assumption that 
N. is not inaccessible. In the case when Naz is inaccessible, we can prove 
(Na, Nz, kK) > Na (<a) only if we use (#*). But using (**), we can prove 
he following much stronger result: 

(#*) THEOREM 7. [f the cardinal number Na >, is strongly inaccessible, 
then (Na, Ns,@)—+Na for every B<a. 

Proor. Let S be a set,S=Na. and f(X) a set-mapping of S of type 
» and order Nz. We have to prove the existence of a free set of power X.. 


Let f(x1,..-, Xx) denote briefly f({x1,-..,x}). Let u(X) ‘be the two- 
ralued measure defined on all subsets of S the existence of which is assured 
yy the hypothesis (##). 
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Let {x1,...,Xx} be an arbitrary element of [S]* and y€S. We define 
the set S.)...., aS follows: Let. 


(1) Sh ey {NEY ES (Xt, 0 Ney XY; XENI, ---, XE Ke} 
We define the set-mapping /’ (xi, ..., Xx) of the set S of type @ as follows: Let 
(2) f' (x1, -- +, Xe) = Ly H(SS Sea er Every, “ix ives ates els]. 

We call f’ the derived set-mapping of f. First we prove the following 
Jemma: 

(3) If f isan arbitrary set-mapping of S of type w and order Np (@<@), 
then the derived set-mapping f' is of order Nz too. 

To see this assume /’(x1,..., Xx) =Np for a certain {x:,..., x:}€[S]*. 
Then there is a set Y (Y—=N;) such that YOf’(x,..., xx). Let Wo} rcog be 
a well-ordering of Y of type ws. For every v<«g, by (2), u(Sz?..2,)=1 
and therefore u( IT S2”..2,)=1, since @<q@ and the measure uw is ad- 


VOB 


ditive for less than N. summands. Thus the set a Si”_.., is non-empty; 


let xo be an element of it. Then y, € f(x1,.. su) 20) for every v < wg, there- 
fore YOf(x1,...,Xk,X0), consequently ee w+ +)Xk,X0) = Ns. This is a 
contradiction, because f is of order Ns. Therefore f’(x,..., Xx) <Np for 
every {X1,..., Xx} € [S]*. 

Now we define the set-mappings fi(X) of S by induction on /. 

Put fo(x) = f(x) and fisi(x)=fi(x). We define S/’'.., writing f,(X) in- 
stead of f(X) in (1). 


(4) The set-mappings fi(X) of type @ are, by (3), of order Nz. 


Now we define a sequence {x,},<o, by induction as follows: Let xo 
be an arbitrary element of S. Suppose that we have already defined the ele- 
ments x, for all « <¥, where »<w@a is a given ordinai number, such that 
xu eS. 

Let S” be the set {x,},<» and Sj’ the set as S(X). We 


— 
XE[S7J No; 1=0, 1, 2, ... 


define the sets Si’... as follows: Let 


y,! : y! 
3) Si |e Sage oO 
scdne LGR Ba RCSE aa veee 
Let further S:’ be the set oy Si)... It follows that S” = 7<N. 
Wy ©1006, tp ES” 51=0, 1,9... 


and S! =7-No-Np<Na. From (5) it follows by the additivity of the 
measure that «(S2’)—0. Thus the set S—(S” + S;'-+-S?) is of measure 1 and 
therefore it is non-empty. Let x, be an arbitrary element of it. 
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Thus we have defined x, for all »<m, and it is obvious from the 
construction that x,- x, for »+-«u. Therefore the set S,— {Xv}r<w, iS of 
power N.z. 


We define the set-mapping g({x}) of S, of type 1. Let g({x})= 
=> fils): S; for every x€S,. We have by (4) that g({x})=Np-N, ie. 


e({x}) is of order Ns.1<Na. Then, by a theorem of Erpos already cited,” 
there is a free set S,&S, of power &. of the set-mapping g({x}). 

We shall prove that S, is a free set of the set-mapping f(x) too. Since 
S,<S,, S, has the form {xy}, hae If S, is not a free set of /f(X), then 


there is a subset {Xr hy Xv} (Ho < +++ <x) Of Se for which Xv, € 
Ef (Xr, 92222 Xry._ > Xry rere Xy,) for an i (O=i=h). If i—k, then Xv, € Sie, in 


contradiction to the construction. Therefore we may suppose that i<k. But if 


i<k, then by the construction Xv, ¢ S3*«. Thus «(S?%x: y “ i : )=1, 
pone - Tey ee Pea PR 
bey by (2), 
Xp EA Xu reser Xu, Xp. rer Xm, ,)- 
Repeating these considerations for f,,f2,... instead of f,, we obtain 
that ~—O and 


x. 19 € fi-1(Xr,,)- 


But this is a contradiction, because S, is a free set of the set-mapping 
g({x}) and Fiu-1(%,,) =E((%,, })- Thus S, must be a free set of f(x) and 


S.=N.: Q. e. d. ; 
(**) THEOREM 8. Jf @ is an ordinal number of the second kind and 
B<a, then (Na, Nz, k)—>®&. for Votre es ciate 
Theorem 8 is a consequence of Theorems 6 and 7. 


THEOREM 9.” 

9a) Let m, be a strongly inaccessible cardinal number, m,>%o, S=m 
and [sy =IJ+ ls for k=1,2,.... Then there exists a subset SES and 
a series {ny}i=1,2,..., Where n= 1, 2, such that Silly’ and [S|'GI for 
every k.— 

9b) Let m, be the first strongly fillceessibe cardinal number greater 
than & and m<m). Let S be a set, S=m. One can define the classes 
Ii, I; for every k so that the following conditions hold: 


11 See [1]. 
12 Theorem 9 gives the solution of the problem of P. Erpéds and R. Rapo mentioned 
on p. 113. The statement 9b) was first proved by G. Fopor. 
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(1) i R=0 ‘forty h1p2h. 

(2) [S!=H+h for k=1,2,...; 

(3) for every infinite subset S, of S there is a k such that neithe 
[S.J SH nor [S,] See 

Proor. The idea of the proof of 9a) is the same as the one we have usec 
to prove Theorem 8. Therefore we shall only sketch this proof. 

We define the classes Urs for every I< o by induction on J. 

Put. 7° —J*, &°=2%. Suppose that /{°', 4°’ are already defined 
and let {x,,...,xx} be an arbitrary element of [s}’. Put) Sea 
max ofxiye. Xe, XECH 2 p and (Secs, atx 1%,--. Xn, xX} E/E. We shall 
say that {x,,...,.JElP'” if u(Sc).2,)=1 and {x,..., x}€2" if u(Si° 2, )=E 
Let wa be the initial number of m. We define the sequence {x,},<w, by 
induction. Let x, be an arbitrary element of S. Suppose that x, is already 
defined for all «<y. For every / and X (X€[{Xu}ucy]~™) there is an 
n(X, 1) (n(X,1)=1. or n(X,1)=2) such that u(Sz"')=1. The set 

Tl S:" is non-empty and we define x, as an arbitrary 
XE[{zu}ucv] ~*~ 0,1,2,.., 
element of it. 

Put S, = {x,},<o,- We split the set S, into classes, x and y belong 
to the same class if and only if for every /<@ {x}¢€J1' holds if and only 
if {y} €/i’' holds. Thus we obtain at most 2% classes, and therefore there 
is a class S,©S, of power m, which satisfies the requirements of Qa). 
Indeed, S, has the form {xy,},<, Suppose that for a & neither [S.] /* nor 


[S]'C i. Then there is a set (Xrypr seer Xo (4H) <-*+<px) and a 


set {Xy,7, teey Xr (Hi < +++ <<) for which (Xv, mys ca €/° and 
{Xayryeeey Xe aie I°. Then, by the construction, (Xp, vee Moy je ** and 
(Xoyt ye eey Xyye_} EL 1 ..., and finally {x }€0 (25:0) € Iy’*"*, but this 


seclee the fact that Xvy ir Xoy/ belong to thé same class So. 
To prove 9b) we shall first prove the following: 
(i) If the statement is true for m= Nz, then it is true for m= 2". 
Let S; be the set {v},<,. Then Si=N. and by the assumption of 
(i) one can define the classes /{, / satisfying the conditions (1), (2), 
of 9b) (with S, instead of S). To prove (i) it is sufficient to define a set S 
of power 2%« and the classes /', I satisfying the conditions (1),(2) and (3). 
Let S be the set of all sequences {¢,},<o, where ¢,—=0O or ¢,=—1. 
Then S = 2%. Let x1, x2 be two arbitrary elements of S, x1--X2, x; = (65) cl 


/ 
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and 2 = (er roy: Let v(x:,X2) denote the smallest ordinal number » for 
which ete. 

We define the usual lexicografical ordering of S, we say that x; <x» if 
and only if é,,,) 0. 

Now let {x:,...,xx} be an arbitrary subset of k elements of S. We 
may suppose that x; <s+< Xe. We write ,...,%%-1 instead of 
¥(X1; Xa), .. +) V(Xe-1, Xx)- 

We define the classes /', ii for k = 2 as follows: 

(a) if 1 < +++ SH OF H> +++ > %-1, then we say that 


bipcomy ef i Or maben 
ner it P(e ys st; Vey Cds *; 

(b) in the other cases let {x1,..., xx} € fi. 

Obviously, conditions (1) and (2) hold for S,/* and Ji. We have to 
prove. that condition (3) holds too. 

Let So be an infinite subset of S. It is well known that there exists a 
Sequence {Xi}i<o© So for which either x1 <-+-<X<+++ OF X1>+-> M+ 
We shall define a subsequence {x;, — for which m,<-++<mM,<-, 
where pi, = (Xi, %,,,). Without loss of generality we may assume that 
Xyp<+++<X,<---. Let » denote the smallest ordinal number which occurs among 
the ordinals ie xv) (l< o,l’<o,l=-l). Let I’ be the smallest integer for 
which e—=1 and let / be the greatest integer less than J’ for which 
g =0. Put x,— x. It is obvious that »(x,, x)=» for every /’=T and 
v (xr, Xv) >” for I’, ’’ ZV. If we repeat this for the sequence x1, X41, ... 
we obtain an elemcnt x, and so on. The sequence {X:,}s<w satisfies | our 
requirement. . 

In what follows we write x, instead of x, and ms instead of m,. Let 
S’ denote the a set .{xs},<. and Sj the set {us}s<w. 

If {ts,,---, Ms, ,} (Ue; <***< Ms, ,) iS an arbitrary finite. subset of Sj, 
then {xs,,..-,Xs,,,%e,} With s,—=S,1+1 is a subset of & elements of S’ 
such that (Xs, , Xs) = Msy,+++> V(Xep_1Xs,) = He,_,- This means by (a) that to 
every finite subset of K—1 elements of Sj there is-a subset of k elements 
of S’ such that the second belongs to Ik or to Ju: if and only if the first 
belongs to It or to I, respectively. But there is a &k for which neither 
[siy" SI nor [Si}* CF} and for this k neither [S’ J cit" nor [S}*"'S Ar" 
Thus the sets S, f', Ii satisfy condition (3) too, and so (i) is proved. 

Let w., denote the initial nuinber of mo. 

(ii) If @ is an ordinal number of the second kind, @ <a and if the 
statement of 9b) is true forevery m—=Np, (8< a), then itis true for m= Nu. 
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Proof of (ii). If Na is inaccessible, then it can not be strongly 
inaccessible, because 0<@< ao. Thus if Nz. is inaccessible, then there is < 
8<a for which N. = 2%, but then, by (i), 9b) is true for Ne. Thus we 


may suppose that No is not inaccessible. 
Let S be a set, S=N.z and vt the smallest ordinal number for whick 
= 2%, Br, <Byo<e@ for %,<%<t. In this case we have T<No 


There is a sequence {S,},<. for which S= 2S, Sy, Sw =0 if m= ve and 
S,=Nz,. By the asstiC Boe corresponding to every set S, (v<T), we Caf 
define the sets /*”, 1” so that (1), (2) and (3) hold for S,,/i'”, h’’ 
instead of S, I, ke, respectively. Put S* = {v},<,. Then S* <<. and we car 
define the sets /|°", 2°" satisfying the conditions (1), (2) and (3). 

Now we define the sets /, /> for kK—1,2,... as follows: Le 
{x1,..., Xx} be an arbitrary element of [S]*. 

a) If for every i (1 Si=k) x;€S,, and v;=»; for every i=-/, then let 


q k, 
: Ke if) {of Sate } 
Mis evens ip ; k, 
Url» , ey € fs if {in1, eter Vy) € Is * 


b) If there is a » for which {x1,..., x} S,, then let 


| ity if {x1, s Rg sti bs iy 
(1, . ++ Xe} E PaaS Ying At 


c) Let {x1,...,x,} €/f in the other cases. 

It is obvious that conditions (1) and (2) hold for /{, /e. 

Let S’ be an arbitrary infinite subset of S. Then either (0) S’-S,=-C 
for infinitely many vy or (00) there is a » such that S,-S’=No. 

If (0) holds, then there is a subset S” of S’ such that S” is infinite 
and S”-S,=1 for every ». Then, by the case a), there is a k for whic 
neither [S”]‘C/! nor [S’/}CR. 

If (00) holds, then there is a » and a subset S’” of S’ such tha 
S’””SS, and S”” = No. Then, by the case b), there is a & such that neithel 
[SiS If ore (Ss? Pf Sir. 

It follows that condition (3) holds, consequently (ii) is proved. 

The statement of 9b) is true for m—W,." ’ 

It follows from (i) and (ii) by transfinite induction that 9b) is true foi 
every m=Na where a< a. 


REMARK. In the proof of 9b) neither (**) nor (*) are used. 


13 See e.g. [5]. 
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LEMMA 5. Let S be a set, S=No and [S]"*? = Io + +++ +h. Then there is 
ani(sis uy) anda subset SoS such that S}=No and [SJ Sh for 
mae, 1, 2,...;°1==0, 1, 2,. 


Lemma 5 is a theorem of RAMSEY." 

THEOREM 10. (m, /+-1, k)— Xo Umea No for v= 1, 2,-5.2 h—= 1,2. 

Proor. Let S be a set, S=No and f(X) a skeen ita of S of 
type k and order /+-1. We shall prove the existence of a free set of power No. 

For every X € [S]* the set f[X] has at most / elements. Let f:(X),..., fi(X) 
denote the elements of the set f(X). (If f(X) has less than / elements, then 


one element may occur more than once.) 
Let us split the set [S]**' into the sum of the sets h,..., 4 as follows: 


If {xo,...,Xx} is an arbitragy element of [S]**', then it is an element 
of /; (for i=-1,...,/) if and only if there is a 7 (Q0=/k) for which 
X= fi ({Xo, ..., Xj-1, Xt, --+, Xe}). If such a fj does not exist, then {xo, ..., xx} 


belongs to Jo. 

Obviously [S]**!= fo+--- +h. 

Let now S” be a finite subset of S and suppose that it has s elements. 
If [S’}*!S/; for some i (1 =i=J, then the set of subsets of S” taken 
k-+1 at a time has at most as many elements as the set of subsets of S” 


taken k at a time. It follows that ES i} = (5) i.e. $=2k+1. Therefore, 


for every infinite subset S’ of S, [S’]#*!S=/; for i=1,...,k. Then, by Lemma 
5, there is an infinite subset So of S for which [So]**?©/, but then So is 
obviously free. Q.e. d. 

‘(##) THEOREM 11. (Nays-1,/+1, ning if eis oth the first kind; 
f+ 1, kK) Na if « is of the second kind (l=1,2,...; k=1,2,...). 

The first part of the theorem is a consequence of Theorem 3. The 
second one follows for «>0 from Theorem 8, and for e==0 from Theorem 
10. The hypothesis (**) is used only in the case when Naz is inaccessible. 

We have stated Theorem 11 explicitly only to make Problem 3 clear. 

In what follows let p, m, / and k denote integers. | 

THEOREM 12. Let p(m,l,k) denote thé greatest integer p for which 
(m,1+1,k)—p is true. Then 


k+1 k 
C1 /m <.p(m, 1, k) < co) mlog m 
where the numbers c, and cz depend on k and | but they does not depend on 
m, and c,>0. 
14 See [9]. 
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k+1 

Proor. First we prove (i) ci/m < p(m, I, k). 

Let-S be a set, Sm and f(X) a set-mapping of S of type & and 
order /+ 1. 

If p is an integer for which there is no free subset of power =p, hed 
every X€[S]’ has a subset Y¢[S]‘*' such that Y is not free. But if 


Y € [S]‘*’, then there exist in [S]’ at most ae] sets X such that 


YCX. Therefore there are at least (™\/ [Feow a sets Y in [S]*+! which 


are not free. On the other hand, we know that there are at most ‘E Z such 


Y’s and therefore we have 


etd Se (7 
m—k—p k 
Cae 
It follows that for such a p 
k+l 
c/m =p 

for some c>0O which proves (i). 

Now we outline the proof of (ii) p(m, 1, k) <¢2 Vielog a log m. Let S be a set, 
S==m and M the set of all set-mappings of S of ‘type k and order /+1. 
We define on M a probability field such that every element f of M has the 
same probability. Let A be the following event: The set-mapping f(X) of S 
of type k and order /+-1 has a free set of p elements. For the proof of (ii) 
it is obviously sufficient to show that the probability of ‘the event A is less 


than 1 if p =co/mlog m. 
The probability of the event that a given subset of p elements of S is 


a free set, is 
rs (i) 
1 


a) 
ese 
Thus the probability of A is less than 1 if 


m— 7?) (i) 


[ 
Ciliecm} 
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It follows that there is a C2 (C2 ¢2(k,J)) for which the probability of A 
is less than 1, if p= com log m. 
k 


Consequently, p(m, 1, k)<coVmlogm. Q.e.d. 


(Received 18 December 1957) 
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GENERALIZATION OF THE INEQUALITY OF P. CIVIN FOR 
THE FRACTIONAL DERIVATIVE OF A TRIGONOMETRICAL 
POLYNOMIAL TO L, SPACE 


By 
I. I. OGIEWETZKI (Dniepropetrovsk, USSR) 
(Presented by B. Sz.-Nacy) 


In the paper [1] Civin has generalized the well-known Bernstein theo- 
rems on derivatives of a trigonometrical polynomial on the fractional index 
of derivative. 

The purpose of this paper is to obtain an analogous result for L, space 
(p = 1), particularly, when the index of the derivative is integer, the paper’s 
results reduce to ZYGMUND’s known theorem (see [2]). 

For a trigonometrical polynomial 


Tn (x) = z + pa (a, cos kx + by sin kx) 


the fractional derivative of order @ is defined as follows: 


T(x) =cos = > kK Ai(x)— sin > > kB(x) 
k=] k=1 
where 
Ax (x) =a, cos Kx +6, sin kx, By(x) = ax sin kx— 6, cos kx. 
Let 


Se 1 
fle —=| JifPaxl?, 
then we show the following inequality: 
|| Tle SC@an*||Trlb (P21) 
where C(a) denotes some constant depending only on «a. 


This inequality represents a generalization of Civin’s inequality to which 


it reduces for p=. 
The method of the proof is based on a devise related to the operation 


of convolution. 
Let 


(1) F(x) = 


cf 


n(X+ y)g(y)dy. 


- 
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It may easily be shown that 
(2) Fi(x) = | TH (x+y) 8 (dy. 


From Clvin’s inequality (max | 7;'| = C(@)n*- max |7,,(x)|) and HOLDER’s 
inequality we have, for p>1 (since F,(x) is a trigonometrical polynomial of 
order n) 

|Fn (0)| S max | Fx'(x)| = C(@)n* - max|Fn(x)| = C(@)2"|| Tr||pl|£ler- 


Hence on the class of functions g for which ||g||),—1 we have 


(3) | Fi: (0)| = C(@)a*|| Tn |lp- 
But if we write in (2) xO, then we get that on the same class of functions 
(4) | Fr (0)| S || Tr lp. 


The inequality (4) is exact, an extremal function of this inequality being 
| [| Tx?" + sg Tr] 
II 7 [Ph 


g(xy)= (p > 1). 
Therefore 
(5) || Tx |p S C(@)n*|| Tr|lp- 


If p=1, it may easily be seen that on the class of functions g for which 
|g(x)|=1 we will have 

| Fr (0)| = C(e)n* || Tah 
and 
(4) | Fr (O)| S| Teh 
where we have an equality for the function g(x): 

g(x) = sg Tx (x). 
therefore (5) holds also for p=1. 
Since C(@)=1 for integer «—k, (5) gives for those « 


|| Tx lp = 2*|| Tally, 
an inequality of ZYGMUND (see [2]). 
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OBOBLUJEHHE HEPABEHCTBA CAMBUHA O NPOM3BOAHONK APOBHOrO MOPAAKA 
TPHPOHOMETPHYECKOFO MHOLOYWIEHA HA CJIYYAM MPOCTPAHCTBA Lp 


HW. HU. O r He BeUKHH (JHenponetposck, CCCP) 


(Pe3rwme) 


n 
; a ° 
fina Tpuronometpuyeckoro muHOrouneHa 7, (x) = 3 -}. > (a,, cos kx + b, sin kx) 
k=1 


po6uHaa mpoussopKaA MOpsAAKa a ONpefenneTcA cnefyroulumM OO6pas0m 


T2 (x) = cos 7% > kA, (x) — sin > > kB), 
=e k=1 


rae . . 
A,,(x) = 4, coskx+ 6, sinkx, B,(x)=4a,sinkx— 6, cos kx. 


n ne 
fell -| fur af 


Torfa cnpaBpepnuBo cnefyroulee HEPaBeHCTBO 

TE llp =C@aA* || Trllp (p= 1), 
rge C(a)— HeKoTOpad nmocToAHHaA BaBMCAWaA: OT @ a He B3aBHCAUad OT NU p. JTO 
HepaBeHCTBO ABIAeTCA OOOOUeHHEM HEPaBeHCTBa CawsuuHa, KOTOpOMy OHO NpuBOosUTCA 


AAA p =e. 
[loxazaTenbCcTBO onupaetTca Ha T.H. M@TOM CBEPTKH. 
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IDEALS AND CONGRUENCE RELATIONS IN LATTICES 


By 
G. GRATZER and E. T. SCHMIDT (Budapest) 
(Presented by A. Rény1) 


Introduction 


One of the important tools of the lattice-theoretical researches is the 
examination of lattice congruences. In connection with lattice congruences 
arises the necessity of the examination of lattice ideals, for 49 — the kernel 
of the homomorphism induced by the congruence relation © — is an ideal 
(if it is any), and this ideal implicates a lot of properties of @. 

In this paper our aim is to examine the. properties of lattice congru- 
ences and the correspondence @-+ /g. Our main tools in the discussion are 
two special types of congruence relations: the minimal congruence relations, 
induced by a subset of the lattice L, and the separable congruence relations, 
respectively. 

In this paper we deal also with three problems of G. BIRKHOFF [2].’ 
We prove a result of J. HASHIMOTO [14] (solving problem 73) in a new 
and more simple way,’ and get a new answer to the question raised in 
problem 72; this has more applications to special cases than the original 
solution of this problem given by T. TANAKA [18]. We obtained a more 
general solution of problem 67 than J. JAKUBIK in [15]. 

The paper consists of four parts. In Part I we deal with congruence 
relations in distributive lattices. First we prove a theorem that describes the 
minimal congruence relations in distributive lattices. By the help of this 
theorem we get a good look at numerous properties of congruence relations in 
distributive !attices, all.of which are able to characterize the distributivity of 
a lattice. We prove, finally, a theorem which is a far-reaching generalization 


1 Numbers in brackets refer to the Bibliography given at the end of the paper. 

2 In his cited paper J. HasHimoto deals with the representations (representation is a 
homomorphism of a lattice onto a ring of sets) of a lattice, and with topologies which 
are defined by special representations and inverse representations. Among the applications 
of these general discussions one can find the solution of problem 73. This explains that 
if we consider a single theorem independently of the others, then the proof seems to be 
rather difficult. It has some interest that while J. HasHimoro ‘uses the Axiom of Choice 
during the proof, we succeeded in omitting it. 
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of many known theorems (which are due to J. HASHIMOTO and M. KOLIBIAR), 
and contains the solution of G. BIRKHOFF’s problem 73 too. 

In Part If we discuss with the help of the notion ‘weak projectivity” 
(introduced by R. P. DiLworTH [3]) the questions related to congruences in 
general lattices. After three preliminary lemmas we get an answer to the fol- 
lowing question: In which lattices is every congruence relation © com- 
pletely determined by the ideal /o consisting of all x with x0? Further on 
we consider the least congruence relation @[/] under which a given ideal 
is a congruence class. We point out that the correspondence /— O[/] is a 
complete join-homomorphism and in.case of distributive lattices it is moreover 
an isomorphism. Finally, we turn our attention to some questions related to 
weak projectivity. 

In Part III we deal with the notion of separable congruence relations. 
After the definition and typical examples we prove some lemmas of prelimi- 
nary character, some of which are interesting in their own right. Next we 
turn to the problem of giving an answer to G. BIRKHOFF’s problem 72, by 
applying the results concerning separable congruence relations. Then we use 
these results in order to characterize the distributive lattices on which the 
congruence relations satisfy the dual infinite distributive law. 

In Parts If and IIIf we get the results of J. JAKUBIK [15] — concerning 
problems 72 and 73 of G. BIRKHOFF, in case of discrete lattices — as trivial 
special .cases. 

We close Part III by analysing a question raised in problem 67 of 
G. BIRKHOFF. 

After some preliminary theorems we deal in Part IV with the problem: 
in which distributive lattices may a Boolean ring operation be defined? We 
describe also in Part IV the types of these lattices and operations. - 

The kernel of this paper has been published in Hungarian in the pa- 
pers [6] and [7]. We supplemented the results by several new ones. For 
instance, the results concerning G. BIRKHOFF’s problem 67 are all new. 


Preliminaries 


Let L be a lattice. The elements of L are denoted by the letters 
a, b,c, :..,X,y, z. If the lattice L has a greatest or a least element, then it 
will be indicated by 1 and 0, respectively. Proper inclusion will be denoted 
by a>b, while the fact that @ covers 6 will be indicated by a>. The 
lattice operations are denoted, as usual, by U and n, while aa and Ado 


will mean the complete join and meet of the elements az, respectively, if 
they exist. If a has a complement, it will be denoted by a’. 
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{x, @(x)} designates the set of all elements x in L for which the pro- 
position @(x), defined on the elements of L, is true. 

The principal ideal generated by a is (a] == {x;x =a}, the principal 
dual ideal generated by a is [a)—{x; x =a} and the closed interval [a, 6] 
mx; as xs OD}. 

The congruence relations on the lattice L are denoted by 0, ®,& n. 
The set of all congruence relations on the lattice L is indicated by O(L). 
The universal and the identical congruence relations are designated by « and 
m, i.e. X==y (t) for all x y€L; x=y (@) if and only if x—y. 

‘Ideals of the lattice L are denoted by the sya. I, Jj Kael hea sets of 
all ideals of the lattice 2 is indicated by &. 

The sets @(L) and £& under suitably defined partial orderings form a 
lattice. This is assured by the following two assertions: 

Under the natural partial ordering, O= © (@, WE O(L)) if and only 
f x=y (O) implies x=y (®), O(L) form a complete lattice. Moreover, 
et A be any set of congruence relations @ on L. We define two new relations 
; and 7 by 

(i) x=y(§) means x=y (@) for all OCA; 

(ii) x= y(n) means that for some finite sequence x = 2, 2,..., 2m==J 

we have 2;-1= 2: (@;) for some 0; € A. 


-Then &, 7 are congruence relations; moreover 7 is the join and & is 
he meet of all OE A. 


LEMMA 1. Let L be a lattice and & the set of all ideals of L. Under 
the set inclusion, © is a lattice with complete union. If A is a subset oie ee 
then we define K as the set of all x for which 


X= YU YU “Un, yi el; 
for some I,€ A. Then K is the complete union of the l€ A. 


The first assertion is due to G. BIRKHOFF [2]; we were unable to find 
a proof of the second one in the literature, but the proof is clear from the ~ 
jefinitions, so we omit it. 

Now we define some special congruence relations. Let S be a subset of L and 
A the set of all congruence relations under which S lies wholly in one congruence 
class. By BiIRKHOFF’s theorem (cited above) the meet of the set of congruen- 
es A is again a congruence relation, and under this, too, all the elements of 
§ are in the same congruence class. Hence there exists a least congruence 
elation under which the elements of S are in the same class. We shall say 
hat this is the congruence relation generated by S, and we shall denote it 
ny O[S]. A special case of great importance is when S contains only two 
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elements a and 0; in this case O[S] will be designated by O.,. A trivial 
connection between the notions @[S] and @,,, is the following 


LEMMA 2. Let S be a subset of the lattice L. Then 
(1) O[S] = eh Ox: 


ProoF. Obviously, @.,, = O[S] for ail a, b€ES, hence Mis 0.» = O[S]. 


On the other hand, S is in one congruence class under V @,,2, for x,y€S and 


a,bES 


x=Ey( V @..») contradict O., = V Ou... Thus O[S] = V @.,. by the 
a,bES a,bES a, bES 


minimal property of @[S], as asserted. 

If L is a lattice, then L denotes a homomorphic image of L, under the 
homomorphism a—> 4, i. e. @ denotes an element of Z as well as the class 
of those elements x of L for which x—>@. If a congruence relation © is 
given, then the homomorphic image of L induced by © (i.e. the lattice of 
all congruence classes) will be indicated by L(@). If there exists an ideal 
which is a congruence class under the congruence relation 0, then we denote 
it by /e. Clearly, /e is the-kernel of the homomorphism induced by 0. 

If in L all bounded chains are finite, then following J. JAKUBIK and 
M. KOLIBIAR we speak of a discrete lattice. Further, if in L between all com- 
parable pairs of elements there exists a finite maximal chain, then we call 
the lattice semi-discrete. (These notions coincide in modular, moreover in 
semi-modular lattices, see e. g. [10].) 

At last, we shall denote by S and T the five element lattices generated 
by the elements x, y,z such that the following identities hold: 


(S) x>y, xUZz=yUz=I1, xNzZz—ynz=—0; 
(Tl) xUp=xUzZz—=yUz—1, xNy=xNz—ynz=—0. 


Il. CONGRUENCE RELATIONS IN DISTRIBUTIVE LATTICES 


§ 1. Description of minimal congruence relations 
in distributive lattices 


It is well known that if @ is a congruence relation, then a=6 (@) if 
and only if aub=anb (@) (see: [2]). From this trivial fact it follows tha 
we need consider only the problem of determining the comparable -pairs o 
elements congruent under the minimal congruence relation, which collapse: 
a comparable pair of elements. (We say that @ collapses a and 6 if they 
are in one congruence class under @.) 
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THEOREM 1. Given two elements a,b of the distributive lattice L with 
a= 6, the elements c,d€L with c=d satisfy c=d (@,,1) if and only if 


(2) (aud)nc=c 
and 
(3) (bud)nc=d. 
Proor. We define the relation © on L by putting 
(4) x=y (9) 


if and only if c—xUy and d=xny satisfy (2) and (3). 

From the identities (@Ux)nx=x, (bUx)Nx=x it follows that © is 
reflexive, and from the symmetry of x, y in the definition of @ it follows the 
symmetric property of @. To prove the substitution law for 0, let us sup- 
pose x=y (Q), and let ¢ be arbitrary, then from the distributivity of L and 
from (2), (3), (4) we obtain 

fau[xuAn(yubin[(xutu(yut)| = {lauceny)] un 
N{(xu y) Ué]= {[au(xny)] N(xuUy)} Ut=(xUy)Ut=(xUh)U(yUd); 
and in a similar way 


taka hate CA) eevenrn HR RLAELTACT UL 
furthermore 
{au[(xnt)a(ynd}in[(xnt)u(ynt)|=f{lau(xnyn(aunyn 
A[(xuy)nt]=[au(xnyn(xuy)n[@us)nt]—={fau(eny)]n 
n(xuy)}nt=(xuy)nt—(xnt)u(ynt), 
and likewise 
{fou[(xnt)n(yut}n[(xnt)u(yn t)}=(@nt)n(ynt). 
Thus these equations show us that x=y (@) implies x uf=yut (@) and 
xnt=ynt (@). , 
- We show the transitivity of @ at first in case u=v2Ww,u==v (@), 
v=w (@). By (4) we get 


(5) (aUv)nNu=u, 
(6) (bUv)Nu=v 
and 

(7) (aUw)nvu=», 
(8) ; (bUW)Nv=wW. 
We prove 

(9) (aUw)Nu=4, 


(10) (bUw)nu=w 
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which are by (4) equivalent to u==w (@). Clearly, from (7) we have au w=», 
applying this fact, u=v, v=w and the distributivity of the lattice we get 


(au w)nu=[@uUw)nujUv=(@UWUve)N (aU ve) = (aU) NG, 


but by (5) u=(aUv) nu, thus (@Uw)Nu—=u, completing the proof of (9). 
From v=w we get bUv=buw, hence, using (6) and (8), 
(bUw)nu=(bUw)N(OUr)nu=(bUW)Nv—»D, 
as asserted. 
Now let us suppose u=v (0), v=w (@) for arbitrary u,v, we€L. 
Applying the substitution law, it follows u Uv =(uUv) U(vn w)=uUvUWw (@), 
uNv=(uNv)NwUW)=—(UNv)N(vNw)—uNvNw (GO), i-e. 


uUvUW=uUv (9), 
uUv=unNv (9), 
unv=unvnw (O). 
But 
uUvUW2uUVVZunvZanvny, 


thus from the previous paragraph it follows that uUvuUw=unvnw (0). 
From the substitution law by direct computation we obtain uUw=(uUW)U 
UuNnw) = [U“UvUWw)N (aU w)] UCN w) = [anon w)n(uw)) Un) = 
=(unvnw)U(unw)=unw (@). This completes the proof of the transiti- 
vity of @. 

We conclude that @ is a congruence relation. Furthermore, a=b6 (@), 
so Y=@,,., Wa» being the least congruence relation with a=b. Again, 
x=y (M) implies in view of Theorem 1 


xUy=[au(xny)]N(xUy) and xny=[bU(xNy)] N(xUy). 
a=b (@,,») and so applying the substitution law twice to the elements 
t=xUy and t—xny, we get [@U(xN yy) N(xUP=—[bU (XN y)] N (XU) (Oa,») 
which is equivalent to x Uy=xNy (@,,») if we take into consideration the 
above equations. Hence x=y (@) implies x=y (@,,,), that iss O=Ou.», 
which compared with the inequality proved above gives the desired result, 
@—@,,., completing the proof of Theorem 1. 


Some of the most important applications of Theorem 1. will be proved 
in the following section. 
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§ 2. Characterizations of distributive lattices 


Some properties of congruence relations of a lattice are suitable to 
characterize the distributivity of a lattice. We shall deduce such characteri- 
zations from Theorem 1. 


THEOREM 2. Each one of the following conditions is equivalent to the 
distributivity of the lattice L: 

(a) if c=d (@,,»), then a<d (or c= 6) is impossible whenever b <a, 
d<c (a,b,c,d€L); 

(b) [6, a] is a congruence class under ©,,, for all b=a (a, b€ L); 

(Cc) O4.N O..a—=o for all a=b=c=d (a,b,c,dEL); 

(d) @.,. has a complement in @(L) (for all a=) such that c2=a 
implies c=a (@%,») (a, b,c € L); 

(e) if C is a chain of the lattice L, then every congruence relation of 
C may be extended to L such that the congruence classes on C remain the 
same ; 

(f) for any ideal I and for any x=y, x=y (O[/)) if and only if 
x=yUv for some véI; 

(g) the condttjon (f) is valid for all principal ideals I; 

(h) every ideal is a congruence class under some homomorphism ; 

(j) every principal ideal is a congruence class under some homomorphism. 


PRooF. First we prove that conditions (a)—(j) hold in a distributive 

lattice L. 
Let us suppose that c==d (@,,.) (a= 6, c >d) and yet b=c, then from (3) 
d=(buUd)nc=c contrary to c>d. We get a contradiction in a similar way 
from a<d and (2). Thus the validity of (a) is a simple consequence of 
Theorem 1. 

From (a) we can easily deduce (b). Indeed, if c=a (@,,») and c[6, a], 
then either cUa>a or cnb<6 holds (for, in case cUa—a and Cn O=—0; 
we should have b=ca, i.e. c€[b, a]). But from a<auc and a=c (@,,») 
we get a=auc (@,,), while b>cnb, c=b (@,,») imply b=cnb (O,,»); 
both are in a contradiction to (a). : 

Now we prove that (c) holds in L. Let a>b2=c>d,x>y and 
x=y (@.1,.N O,,a). Then x=y (@,,a), hence by Theorem 1 


eo) 4 (duy)Nnx=y. 


We assert that cn(dux)>cn(duy). Indeed, if cn(dux)=cn(duy), then 
from the equality cux—cuy (it follows from cUx==cUy (@a) and 
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from (a)) we get cU(d@Ux)=cU(dUy). Thus dUx and duy are both relative 
complements of c’ in the interval [en(dUx),cUx], hence dUx= du y. From 
(11) we infer x—=(dUx)Nx=(dUy)Nx=y, a contradiction. Obviously, 
cn(dux)=cn(duy) (@;,y) and @,,,=@.,s, so we get cn(dux)= 
=cn(duy) (@.s) and a>b=c=cn(dux)>cn(@uy), in contradiction 
to (a). If a6 or c=d, then there is nothing to prove. 

Next let us consider condition (d). We define ® as the join of the 
congruence relations O[[a)] and O[(6]]. Then @.,.U O=+, because for all 
x= yEL, [x, y]E[xnb,yua], thus from xnb=yua (O.,.UD) we get 
x=y (@.,,U @®). Let us suppose that for some x,y€L (x+y) we have 
x=y (O..nN®). This is equivalent to o<@,, and O,,,=0..n ®. 
From the latter @,,,—=0.1NO.,nN® and O= VY. O,,,. Thus (using the 


u>v=a 
uSv=d 


infinite distributive law in @(L), see in [2], [4], or in § 1 of Part II) 0..,— 0,,,N 
nN O,,» n V Ou,» = O.,y nN V(Qa,» nN Ou, v) and from (c) O.,» nN Ou.,¢ == @ which 


To prove the validity of condition (e), let. a chain C be given in L, 
and a congruence relation ® on C. We define the following congruence 


minaries, there exists a finite number of pairs of elements a;, 6; such that 
a; < 6; and a;=06; (®), furthermore x= y( V @,,, »,).. If [x, y] CUlai, 6], then 
t=1 


x==y (®) is valid too and there is nothing to prove. If x== y(®), then there 
exists a part [x,,y,] of [x,y] with the property that for each i either a;< 6; 
Ex<y. Of Y< Sa; <b;. Then from (c) O,,,9 V Oo,,1,==@ which gon- 
tradicts @,,y SV au,,»,- _ 

To verify condition (f), let the ideal /. of L be given and let x= y, 
x=y (O[/]). We prove that x = y (@,,») for some a, bé/. Indeed, from Lemma 2 
O[!]= V Oa, and by BiRkKHOFF’s theorem there exists a finite number of 

a=b 


pairs of elements a;>6;, a;,6;€/ (i=1,2,...,n) such that x=y(V ,,,»,)- 
, i=] 


Let a= Va, and b= 6;, then a, b€/ and obviously x=y (@,,»). Then by 
Theorem 1 x=xn(auy), thus from the distributivity of L we get 
x=(xNa)Uy, hence v—xfa has the desired property. On the other hand, 


it is clear that if x—yUv and vé/, then x=y (O[/]), so we have proved 
the validity of (f). 
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The conditions ¢g), (h), (j) are special cases of (f). 

Now we prove that each one of the conditions (a)—(j) Saat the 
distributivity of L. 

If L is not distributive, then it contains as a sublattice a lattice, iso- 
morphic to the lattice S or T, defined formerly. Since a lattice has one of 
the properties (a)—(j) only if every sublattice of it has this property, so we 
must prove only that the lattices S and T fail to have this property. Among 
the conditions (f), (g), (h), (j) the last is the weakest one, hence in this step 
of the proof we may omit the others. (b) is a consequence of (a), so we 
may omit condition (a) too. 

First we verify that the interval [0,y] is a congruence class under 
no homomorphism in S and T. Indeed, if y=0O (@) for some 0, then 
X= xXN(yUz)=xnN(OUz)—O0 and x¢[0, y], a contradiction. Hence it results 
that in a non-distributive lattice conditions (a), (b), (f), (g), (h), (j) do not 
hold. A similar trivial computation shows that conditions (c) (consider in S 
the chain O, y, x and in T the chain O, x, 1), (d) (in S the interval [y, x], in T 
the interval [0,x] play the role of the interval [6,a]), (e) (see the chains 
described at the condition (c)), do not hold in the lattices S and T. Thus 
the proof of Theorem 2 is completed. 

We mention that the conditions of Theorem 2 play a fundamental role 
in our researches related to all properties of distributive lattices, not only 
in this paper, but in the papers [9], [10], [11], [12] too. 

Conditions (h) and (j) are the same as those of Theorem 2.2 of 
J. HAsHIMoTO [14] (conditions (3) and (4)). 


§ 3. A generalized form of G. Birkhoff’s problem 73 


In his textbook [2] G. BIRKHOFF proposed the following problem: 

Find necessary and sufficient conditions in order that the correspond- 
ence between the congruence relations and ideals of a lattice be one-to-one. 

More precisely: 

Find necessary and sufficient conditions in order that the correspond- 
ence @-—+/e be an isomorphism between @(L) and &. 

Applying Theorems 1 and 2, we get an answer to this question. 


LEMMA 3 (J. HASHIMOTO’s theorem). Jn the lattice L there is a one-to- 
one correspondence (in the natural way) between the ideals and congruence 
relations if and only if L is a distributive, relatively complemented lattice with 


zero element. 


10 Acta Mathematica IX/1—2 
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PROOF. 

The necessity of the conditions. Obviously, J» is the zero ideal-of L. 
Every ideal of L is a congruence class under some homomorphism, so the 
distributivity of L is assured by condition (h) of Theorem 2. 

Now let us suppose that L is a distributive lattice with zero element. 
We prove that L is relatively complemented. By a theorem of J. VON NEUMANN 
(see [2], p. 114), it is sufficient to prove that if b <a, then 6 has a complement 
in the interval [0,a]. Let Va,, be the ideal which consists of all u with 
u=O0 (Q@,,1). Va,» is a congruence class under precisely one congruence 
relation, hence a=6b (@[V.,.]). From condition (f) it follows that for some 
v€ Va, we have 
(12) bUv=a. 

It is clear that »=0O (Q,,»), hence from Theorem 1 e and O play the roles 
of c and d) 

(13) bnv—0. 

(12) and (13) show that v is‘the complement of 6 in (0, a]. 

The sufficiency of the conditions. From condition (h) of Theorem 2 it 
follows that every ideal of L is a congruence class under some homomor- 
phism. Furthermore, every ideal is a congruence class under at most one 
congruence relation, as it follows from the complementedness of the intervals 
of type [0,a] (see [2], p. 23, or the Corollary of Theorem 4 in this paper). 

Now we are ready to prove the general theorem. 


THEOREM 3. Let L be a lattice and “a” a fixed element of L. Eee con- 
vex sublattice of L containing “a” is a congruence class under precisely one 
congruence relation if and only if L is distributive, and all the intervals of 
type [a,b] (a= 6b or a<b) are complemented. 

PROOF. 

The necessity of the conditions. First we show the necessity of the dis- 
tributivity of the lattice L. Let us suppose that Z is not disfributive; then it 
contains as a sublattice either the lattice S or the lattice af (x, y, 2 will indi- 
cate the generators of S or T.) 

We prove that z—a is impossible. Indeed, since xn y+xuy, that is, 
O= @zny,cvy iS not equal to w, the congruence class which contains a 
under @, is different from the congruence class which contains a under w. 
Thus the congruence class under @ containing a contains a.further element x; 
so we may pick out an element c such that c2a and 
(14) c=a (0). 

Now, according as c>a or c <a, the interval [xn ya, a] or [a,x Uyua] is 
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a congruence class under no homomorphism. Let us discuss the case c>a 
(if c < a, then the proof goes on the same lines). Then a=xnyna (®) implies 
(as in the proof of condition (b) in Theorem 2) x=y (®), for any ®, so 
xUy=xNny (P), hence D=O, c=a (®) (see (14)', but cé[xnyna, aj; 
a contradiction. 

Thus we have proved that xUz=yuz and xnz—ynz are 
impossible if za. So we may suppose by the Duality Principle that 
xUazyUa. We assert that under these hypotheses the interval [yn zna, yual] 
(which contains a) is no congruence class under any congruence relation. 
Indeed, if yua=ynzna, then 


z2—=ZU(yNzNa)=zuU(yua)=(zUy)Ua=zUxUa, 


furthermore xNz=xN(zUxUa)=x. But x=ynz,yuaz=ynzZz=ynzna 
and x¢[ynzna,yUal], a contradiction. 

Summarizing the above proved assertions, we get that the existence of 
the sublattices S or T contradicts the fact that every convex sublattice of L 
containing a is a congruence class under precisely one congruence relation. 

Our second aim is to prove the complementedness of the intervals of 
type [a,b] (a= 6 or a<b). Let 6,>6,><a. Since @,,»,+-@, there exists an 
element c, comparable with a, such that c=a (@,,,»,). From condition (a) of 
Theorem 2 we see c < a is impossible. It follows that the congruence class under 
@,,,», which contains a is not empty and it is a part of [a). Hence in [a) the 
condition of Lemma 3 holds, that is, [a) is relatively complemented. In a 
similar way we get the relative complementedness of (a] too. The necessity 
of the conditions is therefore proved. ; 

‘The sufficiency of the conditions. Let L bea distributive lattice such that, 
for a fixed a, the lattices (a] and [a) are relatively complemented. First we 
show that the distributivity of L implies that every convex sublattice is a 
congruence class under some homomorphism. Let D be a convex sublattice, 
I and J the ideal resp. dual ideal generated by D. A trivial computation 
shows that D is a congruence class under O[/]n OL[/]. 

Secondly we prove that every convex sublattice containing a is a 
congruence class under precisely one congruence relation. It is enough to 
prove in case the convex sublattice consists of a alone, for if D is a con- 
gruence class under more than one homomorphism, then let us consider 
among these the minimal one, @[D], and let L-= L(@[D)}) be the corresponding 
homomorphic image of L. In L there are fulfilled all the conditions as in L 
if the fixed element is @, furthermore the one element convex sublattice @ 
is a congruence class under more than one homomorphism of L. So we 
succeeded in reducing the proof to a special case. 


10* 
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Now let us suppose that x>y. It is enough to prove the existence of 
a c with c--a and c=a (@,,,). From the distributivity of L we obtain 
aux>auy or anx>any (aux=auyand anx=any contradict x + y). 
Let c be the relative complement of aUy in the interval [a, aU x] in the first 
case, and the relative complement of anx in the interval [an y,a] in the 
second case. A trivial calculation shows that xy implies c =a in both cases, 
that is, the one element sublattice a is a congruence class only under w. 
Thus the proof of Theorem 3 is completed. 

The proof shows us that Theorem 3 may be sharpened by replacing 
the condition “every convex sublattice containing a...” by the following 
weaker one: “every interval containing a...”. 

That the relative complementedness of the whole lattice is not a con- 
sequence of the condition, it' may be illustrated by the following simple 
counterexample: L is the chain of three elements and a, the fixed element, 
is the only element different from O and 1. 

An immediate consequence of our Theorem 3 is the 


COROLLARY. Every convex sublattice of L is a congruence class under 
precisely one homomorphism if and enly if L is a relatively complemented 
distributive lattice. 


Special cases of Theorem 3 were already known. Lemma 3 (the spe- 
cial case a—=0O) was first proved by J. HASHIMOTO [14] in 1952; a year 
later G. J. ARESKIN [1] has proved Lemma 3, by supposing that the lattice 
L is distributive and has a zero element. The Corollary was proved inde- 
pendently of us — by supposing the distributivity of the lattice considered — 
by M. KOouiBiar [16]. | 

We remark that we may get further theorems, too, as easy consequences 
of Theorem 3. For instance, in [9] we have pointed out that the following 
assertion of J. HASHIMOTO [14] is also a simple consequence of Theorem 3: 

A relatively complemented lattice L is distributive if and only if L has 
an element a such that (a] and [a) are prime factorizable. 

Using transfinite methods it results [11] that Lemma 3 may be sharp- 
ened; in [11] we have published another very simple proof of Lemma 3. 
Related to these questions we refer to [9] too. 
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II. CONGRUENCE RELATIONS IN GENERAL LATTICES 


§ 1. Some lemmas on congruence relations 


In this section we prove three lemmas which will simplify the proofs 
of several theorems in Parts II and III. A part of the merely technical Lemma 4 
was proved already in Theorem 2. 


LEMMA 4. Let & be a binary relation defined on the lattice L. — is a 
congruence relation if and only if 

(a) x=x (6) for all x€L; 

(bh. x=y (6) is equivalent to x Uy=xny (§) for all x, yEL; 

(c) x=y=z,x=y (&) and y=z (&) imply x=z (5); 

(d) if xzy and x=y (8), then xut=yut 6), xnt=ynt () for 
all téL. 

ProoF. Obviously, it is sufficient to prove that a relation & satisfying 
conditions (a)—(d) is a congruence relation. 

By (a) & is reflexive, and by (b) it is symmetric too. 

Let u2v, u=v (&) and a, b€[v, u], then we assert a=b (&). Indeed, 
uZzavb=anb=v and from (d) un (au b)=vN (au BD) (€) and un(au d= 
=vn(aub), thus applying again (d) aub=—[un(aub)JU(and=[vn 
Nn (au b)]U(anb)=anb (&), whence from (b) a=6 (&), and the assertion 
is established. 

Next let x=y (§) and y=z (&). On account of (b) xuy=xny (), 
thus from (d) xUyUz=(xXUy) U(yUZ=(NY)U(yUz)=—yUz (8), simi- 
larly, xn ynz=ynz (6), that is, xUyUzzyUzZzynz=xnynz and the 
consecutive elements are congruent modulo &, so applying twice (c) we get 
xUyUz=xnynz (&). Considering that x, z€[xnyNz,xUyU z], we conclude 
x==z (6), i. e. & is transitive. 

The substitution law may easily be proved too, for if we assume x =y (6), 
then from.(b) and (d) xuy=xny (&) and (xuy)ut=(xny)ut ©), 
but xut, yute[(xny)Ut xUyuUt], hence we obtain xut=yut (§) and 
alike xnt=ynt (&), completing the proof of the Lemma. 

We note that the conditions of Lemma 4 are independent and may be 
weakened, e. g. (a) may be replaced by (a’) x=~y (&) for some x, y€L, but 
we need only the above described form of Lemma 4. 

Now we prove a lemma which sharpens for lattices a similar result 
of G. BIRKHOFF for general algebras (see the Preliminaries). 
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LEMMA 5. Let A be a subset of @(L). We define the relation n:x=y (n) 
if and only if there is a finite sequence XU Y= Uy ZU Zs? Z Un —=XNY 
satisfying u;=u;-. (O;) for some O;€A (i=1,.--, 1). Then 7 is a congru- 
ence relation and n= V Oe ; 


Proor. It is clear that if n is a congruence relation, then 7—VQz. 
Thus it remains to prove that 7 is a congruénce relation. Obviously, it is 
reflexive and symmetric. If x=>y=z, x=y (my) and y=z (m), then we have 
two chains which connect x and y, resp. y and z, having the desired property. 
Joining these two chains, we get one from “x to z with the desired property. 
At last if x=2,=2,=---2z,—y, then tux=tU2z=tUz,2:--2tuz= 
=tuUy, thus x=y (n) implies x Ut==yUt (y), and ina similar way we get 
that it implies xn t=ynt (n) too. We see 7 satisfies the conditions of 
Lemma 4, that is, 7 is a congruence relation. 

The importance of Lemma 5 should be revealed by the fact that it 
decides in the interval [a, 6] whether a=6 is valid or not. For instance, 
applying Lemma 5, it may be proved easily*® the notable theorem of N. 
FUNAYAMA and T. NAKAYAMA [5], according to which in @(L) unrestrictedly 
holds the infinite distributive law 

(ID) OnVO.=V(On @,). 

In proving (ID) it suffices to show that x= y and x=y (V(ON@.,)) imply 
' x=y (OnV@.). If x=y (V(ON®@,)), then’ by Lemma 5 for some finite 
sequence we have x=2%2=2%2°-2%=—y, 2%1=2% (ONG), hence 
2i1=2(@), further on 21=2 (0), so 21=2z; (VQ@.), consequently 
Zi-1= 2% (ONV Ga), that is, x=y (ONVO,), thus OnVO.=V(ON®@,), 
q.e. d. 

According to Theorem 1, in a distributive lattice under @,.,,° (a= 6) 
the elements c,d, (c=d) are congruent if and only if c—(aud)nNe, 
d=(bud)nc. Now we generalize this theorem to arbitrary lattices. 

Obviously, if 


(15) [---({{((@ Ub) U x] 1X5} UX) 1 ++] UXn—=CUd, 
(16) [---({[(@N 6) U x4] N Xs} UX) N +++] UX, —CNd, 


then c=d (@,,), as it follows from the substitution law. 
The theory of congruence relations in arbitrary lattices is based upon 
the notion of weak projectivity due to R. P. DiLwortu [3]. 


5 The idea of this proof of the theorem of ieneen and Nakayama is essentially due 
to R. P. Diwortn [3]. 
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_DEFINITION 1. Let L be a lattice and a, b,c,d€L. The pair of elements 
a, 6 is weakly projective into the pair of elements c, d if for some x1, ...,%.€L 
the equations (15) and (16) hold. 

In what follows a,6—>c,d will denote that a, is weakly projective 
into c,d. Obviously, the relation — is transitive. 

With the help of this notion we can easily describe the congruence 
relation @,,5. 


LEMMA 6 (DILWORTH [3]). c=d (@.,,,) in the lattice L if and only if 
for some finite sequence 


(17) cUd=ypo =n =--- = ye—cNd one has a,b yi, yi (i= 1, 2,...,4). 


Proor. It is clear that if c,d satisfy (17), then c==d (@,,.).. On the 
other hand, let us define the relation € such that u=v (6) if and only if 
some sequence {y,} and c—u, d=v satisfy (17). Repeating word for word 
the trivial calculation of Lemma 5 we get (applying Lemma 4) that & is a 
congruence relation, completing the proof of this lemma. | 


CorROLLarY 1. Let L be a lattice and S a subset of L. S is a congru- 
ence class under some congruence relation if and only if a,b,c€S and 
a,b-+c,d imply déS&. 

Proor. The assertion “only if’ is trivial from the definition, and> “if” 
is obvious from Lemma 2 and Lemma 6. 


From Corollary 1 and from Theorem 1 it results the well-known fact 
that every convex sublattice of a disttibutive lattice is a congruence class under 
some congruence relation. This proof gives perhaps more insight into the 
cause of the validity of the above statement. 

Another trivial consequence of this lemma is 


COROLLARY 2. A lattice L is simple if and only if for all a,6,c,d€L 
there exists a finite sequence cUd=2 222+: 22%,—=cNd such that 
b> Z;-1,2: (i =1,2,..., n). 

If L is a modular lattice and a covers b, then a,6-+c,d implies that 
c=d orc covers d. Thus we are led to 


CoroLiary 3. /f in the simple modular lattice L there exists a pair of 
elements a, 6 such that a covers b, then L is discrete. 


4 Definition 1 is that of [6], but it may be shown easily that it is equivalent to that 
of R. P. Diwortu. The notation is the same as in [6]. 
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§ 2. Weakly complemented lattices 


The notion of weak complementedness was introduced by H. WALLMAN, 
[19] for distributive lattices. Now we define the notion , of weak comple-: 
mentedness® in general such that for distributive lattices this is equivalent to 
that of H. WALLMAN. 

DEFINITION 2. A lattice L with O is weakly complemented if to all) 
pairs of elements a,b (a=+-0; a,6€ L) there exists an element c= 0 such that 
a, b>, 0. 

A trivial computation shows® that in a distributive lattice a>b and 
a,b-—+c, 0 (c4-0) imply anc >0, 6Mc=O0. On the other hand, if anc>0O and 
bnc=O0, then putting c’ —anc we obviously have a,b—c’,O and c’ +0, 
This coincides with the original definition of weak complementedness in 
distributive lattices. 

Weak complementedness is not a homomorphic invariable property, 
that is, there exists a lattice which is weakly complemented, but a suitable 
homomorphic image of it is not relatively complemented. If this lattice is 
distributive, then it is necessarily infinite (see the example in [11]), but 
in the non-distributive case there are finite examples too; e.g. let L be the 
following lattice: 


9 

We can easily verify that this lattice is weakly complemented, yet L(0,, 0) — 
which is isomorphic to the chain of three elements — is not weakly com- 
plemented. 

G. J. ARESKIN [1] proved the following assertion: 

Let L be a distributive lattice with zero element. Every ideal of L is 
the kernel of at most one homomorphism if and only if every homomorphic 
image of L is weakly complemented. 


* It seems to be unreasonable to change the definition of weakly complemented 
lattices, for it is a well-known notion. Our motivation is: the original notion of weak 
complementedness was successfully used only in distributive lattices in discussing the 
connection of topological spaces and distributive lattices [19] and in the researches of the 
congruence relations of distributive lattices [1]. In general lattices only some theorems were 
known which are based on the original definition. For this reason we propose the notion 
of “weakly complemented in the stronger sense” for the original one. 

6 It follows trivially from Theorem 1 too. 
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Now we show that this theorem is valid for arbitrary lattices with the 
above defined notion of weakly complementedness. This is a solution of the 
most natural generalization of G. BIRKHOFF’s problem 73.’ 


THEOREM 4. dn the lattice L every congruence relation is the minimal 
one of a suitable ideal if and only if L has a zero and every homomorphic 
image of L is weakly complemented. 


For the proof a preliminary lemma is needed. 


LEMMA 7. Let L Ue a lattice with zero element. The zero ideal ‘is a 
congruence class under precisely one congruence relation if and only if L is 
weakly complemented. 


PRooF. If the lattice L is weakly complemented, then the zero ideal is 
a congruence class only under w, for if xy, then there exists az+0, with 
x, y— z,0, that is, z=0 (@,,,), i.e. the zero ideal is not a congruence 
class. On the other hand, let us assume that to the elements x, y there is 
no element z with x, y +z, 0. Then z=0(@,, ,), z > 0, is impossible, for if this 
held, then from Lemma 6 it would follow the existence of a z,>0O with 
a, 6+ 2z,,0. Thus the zero ideal is a congruence class under w and @,, , too, 
a contradiction. 

Now we prove Theorem 4. Let / be an ideal which is a congruence 
class under at least one congruence relation. Obviously, / is a congruence 
class under more than one congruence relation if and only if the zero ideal 
of L(@{[/]) is a congruence class under more than one congruence relation. 
Thus the proof of Theorem 4 is completed. 

If L is distributive, then we get from Theorem 4 the above theorem of 


of G. J. ARESKIN.® On the other hand, we want to point out that every rela- 
tively complemented lattice with zero element is weakly complemented, so as 


a trivial special case of Theorem 4 we get a result of G. BiRKHOFF (see [2], 
Dp. 23): 

Coro.iary. Jn a lattice with O, where all closed intervals [0, a] are 
complemented, every congruence relation is determined by the ideal consisting 
of all x with x=0. 

We can get another answer to the above-mentioned problem. 


7 J. JakusiK [15] and J. HasHimoto [14] have also formulated in such a way the 


more natural generalization. ; . 

8 Comparing Theorem 4 with Lemma 3 we get the following theorem of G. J. ARESKIN 
[1]: A distributive lattice with zero is relatively complemented if and only if every homo- 
morphic image of it is weakly complemented. (A far-reaching generalization of this theorem 


may be found in our paper [}1].) 
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If a,o6¢L, then V.,5 will denote the ideal which is generated by all 
x with a,b— x, 0. 


THEOREM 5. /n the lattice L every congruence relation his an ideal as 
a congruence class and every ideal is a congruence class under at most one 
congruence relation if and only if L is a weakly complemented lattice with 
zero element and to all a,b€L there exist a y€ Va,» and a sequence aU b= 
= =dh=---2=d,=—anb with y,0O—-d:1,d; (i=1,..., 2). 


PRooF. We already know the necessity of the existence of a zero ele- 
ment and of weak complementedness. The third condition is necessary too, 
because if for a, 6 it did not hold, then V,,, would be a congruence class under 
more than one homomorphism. Indeed, if V.,, were the kernel of precisely 
one homomorphism, then a=6 (O[Vz,2]) would be valid, and this means juss 
by Lemma 6 the validity of the third condition. 

The sufficiency of the conditions follows from the fact that under these 
conditions 

a=b (@) if and only if V.,,C/e, 
that is, /o determines the congruence relation. Indeed, if a=6 (@), then 
a,b-+c,0 implies c=O0O (@), that is, V..,©@/e. On the other hand, if 
V.,»&J/e, then there exist a y€ V.,, and a finite sequence aUb=y=y,= 
=--Sy,—anb with y,O>y1,y;, but from yeV.,.S/e it follows 
y=0 (@) and so a=6b (0), q. e. d. 

Theorem 5 is a generalization of a theorem of J. JAKUBIK [15]. J. JAKUBIK 
dealt with discrete lattices and he got the conditions of Theorem 5 with the 
small difference that the conditions on a,b are supposed only if a covers 6. 
An easy computation shows that these conditions are equivalent in discrete 
lattices, and what is more it becomes trivial that it is valid not only in dis- 
crete lattices but under that weakened condition, too, that L is semi-discrete. 


§ 3. Minimal congruence relations generated by ideals 


In this section we deal with the correspondence /— Q[/]. 


THEOREM 6. The congruence relation generated by the ideal VI is 
VO[la], thaé is, 


(18) p O[V Ia] = V O[la]. 
PROOF. First we verify that if a=b and a=c, then 


(19) O24 UO. == Oaive 
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Since a=b (@,,u-) and a=c (zou), thus O.,5U Qc,c-SQ@a,sue; on the 
other hand, a=b (@,,») and a=c (@,,.), hence a=6Uc (@,,,U ,,.), that 
1S, Qa, vue = Qa,c U Ga,-. These inequalities prove (19). 

By Lemma 2, (18) is equivalent to 


(20) V @,, ee V V QO, be 


aye V I a@€A a, bel 
ra es Sei eh ete, 


Let us suppose that @,,, occurs in the right side of (20), then a,6€ /. for 
some @€A, hence a,6€ V Ja, thus we obtain that @,,, occurs in the left 
acA 
side of (20), i.e. (20) holds with = instead of —. 
Conversely, let @,,, be a congruence relation which occurs in the left 
side of (20). By Lemma 1 this means the existence of such ia, (€Ja,,@r,€A; 


f—1,2,..°,n) that x,ySio,U---Uis,. Let o= A la, (xn y). Obviously, 
1 
uéela (r=1,..., 1), hence @,,;, occurs in the right side of (20). By (19) 


n 


V Ot. © he OO, ys alld SO 
; : 


a, 


Oy = V V O.,1, 
“ye V I, acA a,bElg 
acA 
that is, (20) is valid. 
Let us denote by @,[/] the least congruence relation under which / isa 
congruence class. Obviously, O[/] = 0,[/] if O,[/] exists.’ 


COROLLARY. /f Q)[la] exists for all a € A, and also ©,[ V Ia] exists, then 
acA 
V Oo[la] = Oo[V Ia]. 


In Theorem 6 we have proved that the join of minimal congruence rela- 
tions of ideals is a minimal congruence relation of an ideal. The analogous 
assertion for the meet is not true as it may be shown by the example of 
the lattice S. It would have some interest to give conditions under which the 
meet of minimal congruence relations remains minimal. We assert only 


LEMMA 8. Let L be a lattice with 0 on which every ideal is a congru- 
ence class under at most-one congruence relation. Let & denote the lattice of 
all ideals in L which are congruence classes under some congruence relation. 


Then & is isomorphic to O(L), i. e. 
(21) OLV L]=V Offa] (la € 8), 
aca aca 


(22) OL Ad=A Olle] (lee); 


9 It would be of great interest to examine ‘the lattice of all ideals for which 9)[/] 
exists. One can easily prove that they form a distributive lattice. 
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[=X aX Kk 


j= Y,>Y,>---DY.=K, 
then there are refinements of these chains of common length. 


Proor. (21) was proved in Theorem 6. (22) follows from the fact that 
the existence of 0 € L implies the existence of A/.; furthermore A/a is a con- 
gruence class under A@[/a]. But A/o is a congruence class under at most 
one congruence relation, hence A@[/.] = O[A/a]. Thus we have proved 
that the correspondence /—> O[/] (/€&) is an isomorphism, between £ and 
@(L), and so © is distributive. Hence the JORDAN—DEDEKIND theorem is 
applicable to @, and this assures the validity of the last statement. 

Now we give a simple answer to the problem formulated above. 


THEOREM 7. The congruence relations of the form O@[/] form a sub- 
lattice of O(L) if © 


(23) @2,00 Qa,c=Qa one for all a=b,asc. 
Proor. We must prove only 
(24) O[L] 0 Off] = V[An 4], 


for the same statement for joins was proved in Theorem 6. Applying Lemma 2, 
(24) get the following form: 
V Oa,0N V 0. a= V @.,y; 

¢, dE Ty 


a, bET, x, yELnI, 
thus from the infinite distributive law we conclude 
(25) V (Oa, oN 0. a) = V O., ye 
a, bET,3¢, dE Ig x, yETnI, 
If @.,, occurs in the right side of (25), i.e, x,y€4Nh, then ©, occurs 
in the left side too, i. e. ' 
0. YD. 4) = 
; bran thes eb) Seg) EeaahY op Ptces 
On the other hand, we see that if t=anbncnd (a,b€1,, c,d€1,), then 
by (23) ; 
; Ooo O., a= Oavv,iN Ona Oraurnteva,t> 


where (aUb)N(cUd)ELNh and té€4nh, i.e. every. member of the left 

side is less than or equal to a suitable member of the right side, and so 

the inequality holds in the reversed sense too, completing the proof of (25). 
The condition (23) is not necessary, not even in modular lattices. 
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As an easy consequence of Theorems 1 and 7 we get: 


COROLLARY. /n a distributive lattice the congruence relations of type 
O[!] form a sublattice of O(L). 


Proor. Let a=6 and ac, then uv (@,,») and u=v (@,,-) under 
the condition u =v are equivalent to (Theorem 1) 


(26) - (aUv)nu=», 

(27) (bux) nu=a, 

(28) (CU vy) Nuun. 

From (27) and (28) by. the distributive law 

(29) u=unu—(bUr)Nun(cUr)Nnu=[(6Nc) Ur] NU. 


(26) and (29) together mean by Theorem 1 that u=v (Q@,,5nc). Thus 
01,50 Oa,c=Oa,onc; the converse inequality is an immediate consequence 
Of as, Oo, c= Qa, one; the proof is completed. 
- We remark that this Corollary is an immediate consequence of condi- 
tion (f) of Theorem 2 too. 
The validity of (21) and (22) is assured under a lot of restrictions by 


THEOREM 8. Let L be a dual infinite distributive lattice with zero ele- 
ment. Then the congruence relations @[I| form a complete sublattice of @(L), 
that is, (21) and (22) are valid. 


ProoF. It is enough to prove (22). This may be treated in a similar 
manner as the Corollary of Theorem 7. It suffices to note that the zero ele- 
ment assures the existence of A/z, and the dual infinite distributive law is 
used in the proof of , 

A 0, Dee Ia, Aba 


which is analogous to (23). We omit here the detailed proof. 


§ 4. Remarks on weak projectivity 


Let four elements a,6,c,d be given. i in L such that a, a,b-—+c,d and 
c,d—+a,b. Then d=b is equivalent to c=d under every congruence rela- 
tion. The situation is the same if a,6 and c,d are projective’ (which shall 
be denoted by [a, 6] 7[c,d] if a=6 and .c=d). The following problem 
arises: give a necessary and sufficient condition under which a,b is 


10 In the literature one speaks about the projectivity of intervals. We say that a, 6 
and c,d are projective if the intervals [aN 6, aU 6] and [cfNd, cUd] are projective in the 
usual sense. Our definition is more convenient in the sequel. 
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projective into c,d if and only if. 

(30) a,b-—c,d and c,d—a,b. 

Now we consider two classes of lattices in which this condition holds. 
THEOREM 9. Let L be a 
A) distributive, or 


B) discrete, modular 
lattice, then a,b and c,d are projective if and only if (30) holds. 


Proor. Evidently, in both cases it is enough to verify that (30) implies 
the projectivity of a, 6 and c,d. 
A) By Theorem 1, (30) is equivalent to (we suppose that a= 6,c=d) 


(31) (auc)Nd=c; 
(32) (6Uc)nd—d; 
(33) (cua)nb—a; 
(34) (dua)nb—b. 
Let us prove the equation bU(aUc)—du(auc), i.e 
(35) buc—dua. 


From (32) bUc=d and from 62a we get bUc=dvuUa and, on the other 
hand, from (34) aUd= 6 and from d=c we get aud =bUc; these inequa- 
lities prove (35). The equations (31), (33), (35) show that the consecutive 
members of the sequence of intervals [a, 6], [a Uc, b Uc], [c, d] are transposed, 
that is, [a,b] IZ [c, d], q.e. d. 

We see that we have proved more than it was required by Theorem 9. 
In addition we get 


THEOREM 9’. @.,,=@,,4 in a distributive lattice L if and only if 
a, 6b and c,d are projective. 


B) The proof may be Hiebinheeles into two assertions. These may be 
proved by trivial induction, hence the detailed proofs may be omitted. 


LEMMA 9. /f L is a modular, discrete lattice and a,b,c€L, asb, then 
under condition B we have" 


I[a, 6} = Ifauc,buc} and a,b] = lance, bn, 
and if a sign of equality holds, then the corresponding intervals are transposed. 


PROOF by induction on /{a, 5]. 


11 [[a, 6) denotes the length of a maximal chain from a to 0. 
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LEMMA 10. ikaw jy is a modular, discrete lattice and a, b,c,d¢ res 

a=b,c=d,a,b-c,d, then 
L[a, 6] = I[c, d]. 

PROOF by Lemma 9 and by an induction on the number of steps in 
the definition of weak projectivity (the number n in (15) and (16)). 

The proof of case B) may be completed as follows: if a= 6 and c<d 
and condition (30) holds, then /[a,6]—//[c,d] from Lemma 10, hence 
[a, 6] 1 [c,d] from Lemma 9, q. e. d. 

By repeated use of distributivity it is clear that if in a distributive 
lattice a, b-+c,d (a= 6, c=d), then for suitable p and q(€L) the following 
two equations hold (see Theorem 1 too): 


(36) (aup)nq=c, 
(37) (bup)ng=—d. 
Now we prove that this property characterizes the distributivity of the lattice L. 


THEOREM 10. The condition a,b-—>c,d (a=b, c= d) is equivalent to 
(36) and (37) if and only if L is distributive. 


PROOF. The sufficiency of the distributivity is obvious. Therefore we may 
restrict ourselves to the necessity. 

Let us suppose that the stated condition holds. We prove that c>d=a 
is impossible. Indeed, if d= a, then bUp =a, and so aUp = bup, that is, 
aUp=bup, consequently c—(aUp)Ng—(bUp)Nq=—d, a contradiction. 

It follows from Lemma 6, that c>d=a,c=d (Q@,,2) is impossible, 
hence from condition (a) of Theorem 2 we get the distributivity of L. 


III. SEPARABLE CONGRUENCE RELATIONS 


§ 1. The definition of separable congruence relations; examples 


In this section we introduce the notion of separable congruence rela- 
tion. This notion will enable us to solve many problems. 


DEFINITION 3. Let L be a lattice and @ a congruence relation on L. O 
is separable if to all a= 6 in L there exists a chain a= 2 S%1S---S%m=—06 
such that for each i éither z;-1==2; (@) or (z:-1 4=2:(@) and) x, y€[Zi-1, Zi], 
x=y (@) imply x=y. 

We also say that this chain {z;} is separated modulo @, or @ separates 
the chain {z;}, or a and 6 are separated modulo @ by the chain {z}. 
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We get immediately from the definition: 

Lemma 11. /f the lattice L is semi-discrete, then all congruence relations 
on L are separable. 

Now let us consider an example” of a non-separable congruence rela- 
- tion. Let L be the chain of all positive integers, together with +o. We 
define x =y (Q) if and only if x—2/, y—2i+1 for some ‘=—1,2,... 
Obviously, @ is non-separable, e.g. no chain separates 1 and + ~. 

From the definition it is also clear that if @ is separable, then between 
all a, b (a= 6) there exists a maximal chain such that on this chain there is 
but a finite number of congruence classes with more than one element 
under @. Indeed, every maximal chain which refines a separating chain has 

the required property. , 
| The converse statement is in general not true. It is neither true that if 
© is a congruence relation such that. between all a>06 there is a maximal 
chain with the property. described above, then © is necessarily separable. 
The statement: if @ is separable, then all maximal chains between any a= 6 
have the property described above, is also false. Counterexamples may be found 
in § 4 of this Part, see examples (A) and (B). 

Some typical examples on separable and non-separable congruence 
relation will be shown by the following lemmas. 


LEMMA 12. Let L be a lattice with the greatest element 1, and I a 
neutral ideal’ of L. @{l| is separable if and only if I is a principal ideal. 


PRoor. If 1 and y(€/) are separated under O[/] (/ + L) by the chain {z;} 
{i=1,...,2), then it may be supposed that z,—y, z;—=1 (a=3). There is 
no subinterval of [z., 1] which is congruent under Q[/], thus z, is the gener- 

ating element of /. On the other hand, if /=(a], then x = y may be sepa- 
' rated under @O[/] by the chain y=xn(yUa) =x." 

The following is a significant example of a non-separable congruence 

relation of distributive lattices. 


LEMMA 13. Let an infinite sequence of elements a—=a,<6b,<+++<a< 
<b;<+++< 5b be given in the distributive lattice L. Then V O,,, 3, Is” not 
t=1 
separable. 


12 This example is generalized by Lemma 13. 

18 The ideal / of the lattice L is called neutral if for any ideals J, K of L, the sub- 
lattice of the Jattice of all ideals of L generated by J, J, K is distributive. If-/ is neutral, 
then x=y under 9[/] if and only if (xNy)Ui= xUy for some i€J. For this fact we 
refer to [2], pp. 28, 79, 119 anc 124, or to [14], p. 167. 

4 If in Lemma 14 we omit the condition that ZL has a unit element, then the 
assertion does not *emain valid. 
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Proor. Suppose that © — V @a;, 0; iS separable, and let {z;} be a chain 
which separates a and 6 (Q=4<24< +++ <%=). If z-1=2; (@), then 
Zi 1=2(V Boj,, >; x > that is, already a finite number of the ai, 6) generates all 
Eaapruences on the chain {z,}. Let [a:, 5.) be an interval’ different from the 
above ones. Let @’,,,», be the complement of @,,,., (see condition (d) of 
Theorem 2), then a=b (@a,, », U @'o,, »,), AED (0 a, v4) (for a, == b&: (O's, »,))- 
Hence for a suitable index 7 we have z;-: + z; (@’.,, »,). According to Lemma 


5 applied to z;-1= 2; (O'a,, o,U Qn,,»,), there is a pair of elements uw, v such 
that 2;.1=u<v=z; and “=v (@u,,,). On the other hand, z;-1= 2; (Q), 


that is, u=v (@) whence uv (V Oa;, o,): Comparing this with 
the above congruence we get u=v (@,,,3,N V On, bj)» that is, 
pt | 
u=v (VO. agp Oj, N @a,,»,)). From the conditions of the Lemma and. from 
[a;,, 53, rr ae 6], we get for each / either a, < b;,<a,< 0; or <b < aj, < 6;,. 
Thus by condition (c) of Theorem 2 we get Ou,,, 0, M @,;, 3,.= @. Hence the 
above congruence becomes u=v (@), i.e. u=v, in contradiction to u < v. 
The proof is completed. 

Now we prove 

Lemma 14. The separable congruence relations on L form a sublattice 
@,(L) of O(L). O.(L) contains « and o. 

Proor. It is clear that « and w are separable, so @,(L) is not the void 
set. Furthermore, let 0, ®€ @,(L), and let a=b (a,b€L). The chain {z;}; 
separates a and 6 modulo @, and let {u,;}; be a chain which separates z; and 
z:-1 modulo ®. A rather simple computation shows that the chain {u,, ;};,; sepa- 
rates a and b modulo Ou @ as well as modulo @n ®, completing the proof. 

@(L) is distributive, hence its center @,(L) is the set of all congruence 
relations having a complement. It is well known that @.(L) is a sub- 
lattice of O(L). (It is trivial from the identities (OU ®)=—O'n ®' and 
(On 0)! =O'U®D') 

Lemma 15. If the congruence relation © has a complement, then it is 
separable, that is, 9.(L)&@,(L). 

Proor. By Lemma 5, to all a>6 there exists a chain a==2)=-++:=2,—0 
such that either z;,==2z;-1 (O) or z:=zi-1 (@’) for every i. We assert that 
the chain {z;} separates a and 6 modulo @. Indeed, if x,y €[zi,2:.] and 
Z+£2z,1 (@), furthermore x=y (@), then from x=y (@’) we get 
x=y (On @’), that is, x—y, g. e. d. 


11 Acta Mathematica IX/1—2 
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Corottary. /n a distributive lattice all congruence relations of the form 
@,,, are separable. 


This is an immediate consequence of condition (d) of Theorem 2 and 
of Lemma 15. 


§ 2. Weakly modular lattices and G. Birkhoff’s problem 72 


First of all we introduce the notion of weakly modular lattices. It plays 
an important role in the discussion of problem 72 as well as in our resear- 
ches concerning the so-called standard ideals (see [8]). 


DEFINITION 4. The lattice L is weakly modular if a,b—c,d 
(a<b,c-d, a, b,c, d € L) implies the existence of elements a,, 6; (@=a,<b,= b) 
such that c,d— ay, by. 


The weakly modular lattices are a common generalization of the modu- 
lar and relatively complemented lattices’ as it is assured by 


LemMA 16. /f L is a 

(a) modular, or 

(b) relatively complemented 
lattice, then it is weakly modular. 


Proor. The case (a) is an immediate consequence of the isomorphism 
theorem for modular lattices (we refer to [2], p. 73). Now consider case (b). 
Let a>6b and anx>y206nx. Then denoting by z the relative complement 
of y in the interval [on x,anx], we have anx,y—6,b6Uz and 6<bUzSa, 
for [((anx)nz]Uob—6buUz and (ynz)U-b=6. In the same lines it may be 
proved that in case a>b,aux=y>buUx, we have bUx,y—aQ,a for 


15 The necessity of a common generalization of modular and relatively complement- 
ed lattices has arisen in many cases. Let us consider an illustrative example. DstwortH 
and Hatt [4] proved — generalizing a theorem of G. Birknorr — that every weakly atomic 
(a lattice is called weakly atomic, if any a>6 implies the existence of c,d with a=c>d=>b) 
modular lattice is the subdirect product of projective lattices (a projective lattice is a lat- 
tice in which all prime intervals are projective). J. Hashimoto [13] proved a similar result for 
relatively complemented lattices. Thus the necessity of a theorem arises which is a com- 
mon generalization of the above mentioned ones. Let us call the lattice L weakly projec- 
tive if for any pair of prime intervals p,q the relations p—+q and q — :p hold (the notations 
are that of § 3). Obviously, any weakly projective modular or relatively complemented lattice 
is projective. We assert: Any weakly atomic, weakly modular lattice is a subdirect product 
of weakly projective lattices. The proof goes on the same lines as the proof of the asser- 


tion of Ditwortu and Hatt, or, what is the same, the proof of J. Hasuimoto. This is also 
a consequence of Lemma 18. 


IDEALS AND CONGRUENCE RELATIONS IN LATTICES 163 


suitable a >a, = 6. The proof may be completed by an easy induction on n 
of Definition 1. 

From Lemma 16 it is also clear that the weakly modular lattices gener- 
alize the modularity in another way than the semi modularity. We remark 
that by the Corollary 2 of Lemma 6 all simple lattices are also weakly 
modular. 


An important property of weakly modular lattices is proved in 


LEMMA 17. Let L be a weakly modular lattice and ® a congruence rela- 
tion on L. Define x=y (@*) if and only if in the interval [xn y, x Uy] every 
congruence class under © consists of a single element. Then @* is a con- 
gruence relation, furthermore @* is the pseudo-complement* of © in @(L). 


Proor. Owing to the definition of @*, it is reflexive and satisfies the 
condition (b) of Lemma 4. Let u>v>w,u=v (O°) and v=w (6°) and 
let us suppose that for some u=x>y2Zv we have x=y (@). Since 
x=y (O,,.U @,~), from Lemma 5 it follows the existence of x,, y, such that 
x=x,>yi=y and either u,v—X,,y, or v, W—x,, y,. From the weak modu- 
larity it results that X,,y,—v,,W, for some v2v,>w,2w or X,y>. 2, 
for some u2=u,>v,Zv. But x=y (MO) implies 4,=w, (Q) or 1=r, (0), 
in contradiction to v=w (@*) or to u=v (@"). The cases uv and v=w 
are trivial. Finally, we prove that x 2>y and x==y (0°) imply x Ut=yut (@*). 
Indeed, if x Ut=yut (@*) is not true, then u=v (@) is valid for some 
xUt=u>v=yut. From the weak modularity it follows that w>v—-x,,y, 
for some x=x,>y,=y, that is, x=y (@*) is false. Thus we have proved 
the validity of the conditions (a)—(d) of Lemma 4, and so @* is a con- 
gruence relation. The last assertion of the lemma is clear. 


COROLLARY. Any separable congruence relation of a weakly modular lat- 
tice has a complement, that is, O,(L) = O.(L). 


Proor. Let © be separable; we assert that the congruence relation @* 
of Lemma 17 is the complement of @. Indeed, if a=6 (a,b€L), then let 
Q€=2%=2%=+:-=2Zn—5 be a chain which separates a and 6 modulo 0. If 
2: == z:-1 (9), then by the definition of @* it follows z;== zi: (O*), whence 
a=b (Ov @"), completing the proof of OU @"=«. 

Now we proceed to problem 72 of G. BIRKHOFF (see [2], p. 153): 

Find necessary and sufficient conditions on a lattice L that its con- 
gruence relations should form a Boolean algebra. 


16 Let L be a lattice with 0. The element a* is called the pseudo-complement of @ 
if x a=O is equivalent to x =a’. 


Me 
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First T. TANAKA [18] gave an answer to this question.” He got the 
following interesting theorem which is a generalization of a theorem of R. P. 
Di-wortH [3]: 

The congruence relations of the lattice L form a Boolean algebra if and 
only if L is a discrete subdirect product of simple lattices. (Discrete sub- 
direct product is a subdirect product in which any two elements differ only 
in a finite number of components.) 

The theorem of T. TANAKA may be considered as the structure theorem 
of lattices L for which @(L) is a Boolean algebra. However, in some 
respects the following theorem is more applicable to interesting special 
cases: 


THEOREM 11. The congruence relations of the lattice L form a Boolean 
algebra if and only if 

(W) L is weakly modular 
and 

(S) all congruence relations on L are separable. 


PROOF. 


The necessity of the conditions. Let us suppose that @(L) is a Boolean 
algebra for the lattice L. Then by Lemma 15 all congruence relations are 
separable, hence (S) is necessary. 

Let us suppose that a,b—>c,d (a>6,c+d). @.,, has a complement, let 
us denote it by ®. Now, a=b (@,aU ®), but in case a=b (®), it follows 
that c=d (®) which is impossible, so a==6 (®). Thus Lemma 5 implies 
that for some a=a, > 6,=5 the relation a,=6, (,,2) holds. By Lemma 6 
this implies that for some a,=a,>6,=6,, c,d—> ay, 6, is valid, thus in case 
@(L) is complemented, (W) holds. 


The sufficiency of the conditions. By (W), 0.(L)=@,(L), as it was 
proved in the Corollary of Lemma 17. Condition (S) is equivalent to @(L) = 
= @,(L), thus @(L)= @,(L), as we wished to prove. 


We get from Theorem 11 a lot of Corollaries. 


: 
: 


COROLLARY 1. The lattice of all congruence relations of a 
(a) modular, or 


11 The result of T. Tanaka remains valid in abstract algebras, too, this explains that 
for lattices one can get sharper results. We note that while the result of T. Tanaka de- 
pends on the Axiom of Choice, our result does not use it. 
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(b) relatively complemented ® 


attice is a Boolean algebra if and only if the condition (S) holds. 
It follows from Theorem 11 and from Lemma 16. 


In case the distributivity of L is assumed, we can get further improve- 
nents. 


COROLLARY 2 (Theorem of J. HasHimoto [14]). The lattice of all con- 
yruence relations of a distributive lattice L is a Boolean algebra if and only 
f L is discrete. 


ProoF. By Corollary 1 it is enough to prove that in distributive lattices 
S) is equivalent to the discreteness of L. Indeed, if L is discrete, then by 
emma 11 (S) holds. On the other hand, if Z is not discrete, then by the 
isual method of bisection of intervals we get a sequence of elements re- 
juired in Lemma 13, so that, by this lemma it follows the existence of a 
1onseparable congruence relation, that is, condition (S) is false.” 

In case of modular complemented lattices, SHIH-CHIANG WANG got a 
ondition for the complementedness of O(L). 


COROLLARY 3 (Theorem of SHIH-CHIANG WANG [20]). The lattice of all 
ongruence relations of a complemented modular lattice is a Boolean algebra 
f and only if all neutral ideals are principal. 


PRooFr. By a theorem of G. BIRKHOFF, every congruence relation of a 
complemented modular lattice is a minimal congruence relation of a neutral 
deal. By Lemma 12, the minimal congruence relation of a neutral ideal is 
eparable if and only if the ideal is principal, and so Corollary 3 follows. 

It is surprising that Corollary 3 which seems to be true only in comple- 
nented modular lattices remains true after omitting the condition of modu- 
arity, provided that we replace neutral ideals by standard” ones. In [8] we 
roved that every congruence relation of a relatively complemented lattice 
vith O and 1 is a minimal congruence relation of a standard ideal, thus the 
roof of Corollary 3 may be applied to establish 


18 The results of this section were published in [7] in 1957. At the same time, 
‘Hasnimoro published in [13] the following result: If in L the restricted chain condition 
olds (that is, in every (closed) interval of L the maximum or the minimum condition 
olds) and L is relatively complemented, then 6(L) is a Boolean algebra. Indeed, the 
sstricted chain condition is a special case of semi-discreteness, further, on any semi- 
iscrete lattice all congruence relations are separable (Lemma 11), thus the assertion follows 
om the part (b) of Corollary 1. 

19 For a direct proof of Corollary 2. see our paper [12]. 

20 We have introduced the notion of standard ideals in [8]. Among the more than 
sven equivalent definitions now we formulate only the following two: (a) the ideal / is 
lied standard if for any ideals J, K of L the relation JQ (/U K)= (Jn Lun &) holds; 
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COROLLARY 4. The lattice of all congruence relations of a relatively 
complemented lattice with 0 and 1 is a Boolean algebra if and only if all 
standard ideals are principal. 


We get other types of Corollaries if we restrict our consideration to 
discrete or semi-discrete lattices. In semi-discrete lattices (S) is valid (Lem- 
mall). We prove that in semi-discrete lattices (W) is equivalent to 

(J) weak projectivity between prime intervals is symmetric. 

(The interval [a, b] is called prime if 6 covers a.) Indeed, if (W) holds 
and 6 covers a, d covers c, a,b-—>c,d, then for some 6=0b,>a,=a, 
c,d—a,,b, is valid, but from the covering relations we infer b=—06, and 
a=ay,, hence (J) is valid. On the other hand, assume the validity of (J), 


and let a,b->c,d, a< 6b. Let a=x)<X,<-++<xX,—=05 be a finite maximal 


chain between a and 6. Then c=d ( U Q..,, x, ,), So that by Lemmas 4 and 5, 
‘=1 


for some cndSc,~<d,=cud and for some i, Xi-1, Xi, d, is valid. But 
then by (J) ¢c,, d: + Xi, Xi-1 and the assertion follows. Thus we have 


COROLLARY 5. The lattice of all congruence relations of a semi-discrete 
lattice is a Boolean algebra if and only if the relation of weak projectivity 
between prime intervals is symmetric. 


Corollary 5 in case of discrete lattices was firstly proved by J. JAKUBIK [15]. 
We shall weaken the conditions of Corollary 5 in the following section. 


§ 3. Special properties of ©(L) 


If we can construct from the lattice Z a new lattice, then it is always 
interesting to characterize those lattices for which the new lattice has some 
special properties. So, for instance, the characterization of those lattices for 
which @(L) is a Boolean algebra was the content of § 2. Now we consider 
further problems of this: kind. 


(b) the ideal / is said to be standard if x=y under @[J/] if and only if ~Ny)Ut—=xUy 
for some ¢€/. From (a) it is clear that the notion of standard ideals is a generalization 
of the neutral ideals; from (b) we see that the proof of Lemma 12 for standard ideals 
remains valid. 

In [8] we have proved Corollary 4 in another way. We can sharpen Corollary 4, 
for in [8] we have proved that in a weakly modular lattice all standard elements are neutral 
and in a relatively complemented lattice all ideals which are congruence classes under 
some congruence relation are standard, thus we get: the lattice of all congruence relations 
of a relatively complemented lattice with 0 and 1 is a Boolean algebra if and only if every 
ideal which is a congruence class under some congruence relation is a principal ideal. 
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We know that in @(ZL) the infinite distributive law 

(ID) OnNVO.=V(ON Oa) 
holds, but, as it was pointed out by N. FuNayamMA and T. NAKAYAMA [5], 
the dual law 

(DID) OUAG.=A(OU Oz) 
does not hold in general. Let us consider the lattices in which (DID) does 
hold. First we prove 


LEMMA 18. Let © be a separable congruence relation of L. Then for 

any subset A of O(L) 
Ou A O.= A (OUQB,) 
O,EA O,EA 

is valid. 

Proor. Since OUAQ.=A(@U@.) is true in any complete lattice, it 
is enough to verify that OUAQz=A(QU@.). Let x=y (A(OU O,)); 
since @ is separable, there exists a chain xUy=22=2%,2-:-=2%n—=xNy 
separating x Uy and xn y modulo @. If z;==2;:-1 (M) for some i, then from 
Zi-1 = Zi (A(O U Ga)) we get 2; = 2Zi-1 (AQz). Thus for every / either 2; = z;-1 (O) 
Or %=2i-1 (AQz), that is, x=y (OUAQO.), which we intended to prove. 


CoROLLARY. /f all congruence relations on L are separable, then (DID) 
holds unrestrictedly. 


Lemma 18 or its Corollary may not be conversed, as it will be shown 
in § 4 by a counterexample (example (C)). 

Now we characterize the distributive lattices L such that in @(L) 
(DID) holds. 


THEOREM 12. Jn the lattice of all congruence relations of a distributive 
lattice (DID) holds unrestrictedly if and only if L is discrete.” 


Proor. If L is discrete, then all congruence relations on L are separable 
by Lemma 11, thus, by the Corollary of Lemma 18, (DID) holds in (LZ). 
On the other hand, assume that (DID) holds in O(L). Let OC O(L). 
then @= YV @,,». By condition (d) of Theorem 2 any @,,, has a com- 


a= b(®) 


plement @,,. Put D= A 2,0, then by (ID) 
) 


a=b ( 


On D = V Oa. N(A G2.) = V(OQa,0N AG, +) SV (as N Oi,1) = Vo =, 
hence On ®=«w, and from (DID) 
Ou D=VOu,1U(AO%,1) = A(O4,0 UV Oa, ») = A(O5,» U Oo, ») = & 


21 A simple proof of Theorem 12 was published in our paper [12]. 
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(the A and Y are extended to all a, 6 with a=6 (@) in all above formulae), 
thus @U ®—1, that is, ® is the complement of @. Thus O(L)is a Boolean 
algebra, hence from Corollary 2 of Theorem 11 L is discrete and the theorem 


follows. 
* 


Now we consider a question related to problem 67 of G. BIRKHOFF [2]. 
Let P be the set of all prime intervals ofthe lattice L; the elements 


of P are denoted by p,q. If p=[a, 6] and q=[c, d], furthermore a, bcd, 
then we write pq. The elements of P under the relation — are quasi- 


ordered, thus if we identify those p,q for which p—-q and qg—p simul- — 
taneously, then we get a partially ordered set which will be denoted also - 


by P. Now we are seeking for a condition under which O(L) = 2?. (2 denotes 
the lattice of two elements. The definition of 2? may be found in [2], p. 8.) 


LemMMA 19. For any lattice L, 2? is a complete homomorphic image of ~ 


@(L). 

Proor. We say that the congruence relation © collapses the prime 
interval p, if p=[a, 6] and a=b (@). We call a subset A of P s-ideal, if 
péA and p—q imply qgcA. We assert that every s-ideal may be regarded 
as the set of all prime intervals collapsed by some congruence relation. 
Indeed, if @ is a congruence relation, then the set of all collapsed prime 
intervals A form an s-ideal, for if p€A and p-— gq, then q is also collapsed 
by ©. On the other hand, let A be an s-ideal of P, and let us define 
®O— VY @,». Under © the prime intervals of A are collapsed, further- 


pla, JE A 
more if q is collapsed by @, then g=[a, 6], a=6 (@), thus, by Lemmas 4 
and 5, p—+q for some péA, hence géA. 

In a similar way we get that if under ® and © the collapsed prime 
intervals are Aw and Ag, respectively, then under @U@® and ©n @ the col- 
lapsed prime intervals are ApU Ae and Agf Ae, where U and fn denote the 
set theoretical meet and join. Thus the set B of all s-ideals of P, partially 
ordered under set-inclusion is a homomorphic, moreover, .a complete honto- 
morphic image of @(L) (naturally the void set is also regarded as an s-ideal). 
It is evident that B is isomorphic to 2’, completing the proof of Lemma 19. 


A trivial condition concerning the problem under discussion follow 
from Lemma 19. ' 


. THEOREM 13. The isomorphism @(L)~ 2? holds if and only if to any 
pair O> D (0, DEO(L)) there exists some p€P collapsed by © but not by @. 


Proor. Since 2? is a homomorphic image of @(L), the condition of 


Theorem 13 is necessary and sufficient in order that this homomorphism may be 
an isomorphism. Q. e. d. 
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As a trivial consequence of Theorem 13 we get immediately a sharpened 
form of a theorem of J. JAKUBIK [15] (he restricts himself to discrete lattices; 


in § 4 we prove by examples that the following Corollary is more sharpen 
than JAKUBIK’s theorem): 


COROLLARY 1. If L is a semi-discrete lattice, then @(L) = 2”. 
Instead of proving it we shall verify a more general assertion. 


COROLLARY 2. Let L be a weakly atomic lattice with separable congru- 
ence relations. Then @(L) = 2?. 


Proor. It is enough to prove that if @ > ®, then there exists a prime 
interval p which is collapsed by © but not by ®. As a matter of fact, there 
exists a pair of elements a,b with a>b, a=b (@) and a=6b (®), and 
there exists a chain which separates aand 6 modulo @; let a—z,=---=z,=—b 
be this chain. Choose an index i for which z;==z;-1 (®). Then no subinter- 
val of [z:, 2:-1] is congruent under ®. By weak atomicity there is a prime 
interval p in [z;,2:-1]; thus p is not collapsed by ® but is collapsed by 0, 
completing the proof. 

Theorem 13 and Corollary 2 may be regarded as a general solution of 
G. BIRKHOFF’s problem 67. 

From Corollary 1 one can deduce Corollary 5 of Theorem 11 using 
only the fact that 2” is a Boolean algebra if and only if P is unordered.” 
Thus from Corollary 2 of Theorem 13 we get a generalization of Corollary 
5 of Theorem 11: 


Let L be a weakly atomic lattice with separable congruence relations. 
@(L) is a Boolean algebra if and only if weak projectivity is a symmetric 
relation among its prime intervals. 


§ 4. Counterexamples 


Now we construct some counterexamples to questions raised in Part III. 

(A) There is a lattice having a congruence relation @ and a maximal 
chain C such that © induces on C an infinity of congruence classes 
of more than one element. 


22 Let us prove that 2? is a Boolean algebra if and only if P is unordered. Indeed, if 
P is unordered and f €2?, i.e. f is an isotone function from P to 2, then define g by 
g(a) =0 if f(a)=1 and g(a)—1 if f(a) =—9. Obviously, g is the complement of f in 2?. 
On the other hand, if x, y€ P and x > y, then consider the function f for which f(x)— 1, 
f(y)=0. If g is the complement of f, then max (f(a), g(a))=1 for all a€ P, that is, 
g(y)=1, min (f(a), g(a)) =0 for all a€ P, whence g(x)—0, g is not isotone, a cont- 
radiction. 
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EXAMPLE. Let P be the chain of all non-positive integers together with 
— oo, with the. natural ordering. In the cardinal product of P with itself let 
us consider the congruence relation @ = Oo, «-«,0) and a maximal chain C 
which consists of all elements of type (x, x). By the Corollary of Lemma 15 
© is separable, yet on the chain C it induces an infinity of congruence 
classes with more than one element. 

(B) There exists a lattice L on which there is a non-separable congruence 
relation © with the property that any a,b (a= 6) may be connected by a 
maximal chain on which there is but a finite number of congruence classes 
of more than one element. 


EXAMPLE. Let P be the chain of all non- negative integers and let L be 
the lattice P-P bounded with /, and 0 = Vv O 21,0) 2i+1,0 By Lemma 13, 0 


is non-separable. Let a> 6. We may suppose a=T unless [b,a] is finite. 
If a=/J, then a chain with the required properties is formed by the elements 
(b,, x), where 6==(6,, 6,) and x runs over the numbers 82, 0,.++1,8+2,.... 

It is of some interest that examples (A) and (B) could be constructed 
among distributive lattices. 

(C) There is a lattice L with the property that in @(L), although the 
dual infinite distributive law unrestrictedly holds, yet there are non-separable 
congruence relations. | 


EXAMPLE. Let P be again the set of all non-negative integers and let 
L consist of P and of three new elements /,x, y. L will be a lattice if the 
partial ordering of P remains the usual and the following relations hold: 
xUi=yui=—=xUy=—=xul=—yul=iI, 
xNni=yni=/nO=—0 fora rer 
Let us have a look over the congruence relations of this lattice L. It is easy 
to verify that /==i and i=0 (i=0) hold only under ¢. This implies that 
with the exception of « all congruence relations of L are those of P, in the sense 
that the congruence relations of P are extended to congruence relations of L 
such that the congruence classes outside P consist of one element only. 
In @(P) the law (DID) is satisfied as we proved it in Theorem 12, thus a- 
trivial calculation shows its validity in @(L) too. Yet in @(L) there are non- 
separable congruence relations, for instance, let x==y (@) if and only if 
x=2i+1 and y=2i (i is arbitrary, i€ P, i+ aN then one cannot separate 
e.g. 1 and /. 
Naturally, all counterexamples of type (C) are non-distributive, for if 
L were distributive, then by Theorem 12 it would follow that L is discrete, 
hence by Lemma 11 all congruence relations on L are separable. 
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(D) There is a semi-discrete but not discrete lattice L, with the pro- 
perty that O(L) is a Boolean algebra.* 


ExaMPLE. Let L be the set of all non-negative integers. We partially 


order L by putting 
é; 2i—1<2i<0, 


2i—1 < 2i+1 

Then L is a lattice which is obviously non-discrete but semi-discrete, fur- 
thermore L is simple, that is, it has all the required properties. 

(E) There is a weakly atomic, not semi-discrete lattice L with separable 
congruence relations such that @(L) is a Boolean algebra.™ 

EXAMPLE. Let L be the lattice of all partitions of an infinite set. Then 
L is a simple, weakly atomic lattice (for the proof we refer to O. ORE [17]), 
thus it satisfies the required properties. 


(i=1,2,...). 


IV. BOOLEAN RING OPERATIONS ON DISTRIBUTIVE LATTICES 


§ 1. A characterization of relatively complemented distributive 
lattices 


In this section we prove a theorem which enables us to prove the 
main theorem of this part without complicated computations. 


Let 
1 Eee a ap ge OF 


and ADS UIT Gite elas Cio, on) 
be lattice-polynomials with the variables x;. 

THEOREM 14. /n a relatively complemented lattice L the system of equations 
(38) = ((21, 2527.) 


has a solution for any 


Ups= Oy o-) Un = Ga (a; ¢L; j =, 2,...,N) 
if and only if (38) has a solution in 2 for any 
; ose D,,.  .5 Ug On (6;€2; 7 = 1, 2,..., n). 


We remark that if m=O (that is the set of unknowns is void), then 
(38) is a system of identities, the validity of which is in question. 


23 Example (D) shows that Corollary 5 of Theorem 11 is applicable to more lattices 


than the original theorem of J. Jakupik. 
24 (E) shows that the assertion formulated at the end of §3 is actually stronger 


than Corollary 5 of Theorem 11. 
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First we prove 

LEMMA 20. Let L be a relatively complemented distributive lattice and 
X,,---,Xn€L. L has a sublattice B, which is a finite Boolean algebra con- 
taining x:,...,Xn (and O(Bn) = 4°).” 

Proor. The assertion for n==1 is true. Now we make an induction 
on n. Let us suppose that we have already constructed B,-1 which contains 
X,,««s,Xn-1- Let On-1,/n-1 be the least and greatest elements “of. »By4; 
respectively. Let us consider in the interval [On-1, Un U/n-1] the relative com- 
plement //,.; of /,-; and let A, and A, be sublattices of L consisting of 
On-1, 1n-1 and XnUIn-1, Xn, respectively. Let B,—=(Bn-1-A.) 0 Az where o de- 
notes the cardinal product, but if B, is regarded as a sublattice of L, then the 
embedding B, in L is effected by (x,y) —~xny. Obviously, B, is a finite 
Boolean algebra and x,,...,x,€8,. The calculation on the number of the 
elements of B, is very easy by the construction. 

Now we prove Theorem 14. 

The necessity of the condition. Consider a finite.Boolean algebra Brim 
containing the elements x,,..., Xm; @,...,@n. (38) is solvable in Bysm, thus 
it is solvable in 2 too. Any choice of a; may be regarded as a homomorphic 
image of a suitable chosen qj. 

The sufficiency of the condition. Let us suppose that (38) may be 
solved for some x;== 6; in 2. Then (38) is solvable in all finite Boolean algeb- 
ras, for (38) is solvable componentwise. Let B, be a finite Boolean algebra 
containing a,,...,@n. (38) is solvable in B,, thus it is solvable in ZL too. 

From Theorem 14 we get easily a theorem which characterizes the 
relatively complemented distributive lattices. 


i THEOREM 15. The solvability of (38) in L is equivalent to the solva- 
bility in 2 if and only if L is relatively complemented and distributive. 


Proor. The case “if was proved in Theorem 14. Now prove the 
“only if’. The identity 
au(6Nc)=(aub)n (auc) 
holds in 2, thus it must hold in Z, that is, Z is distributive. Furthermore, 


the equation system 
(aub)Ux=aubuc, 


(aub)nx—=a 
is solvable in 2, thus it must be solvable in ZL too, hence L is relatively 
complemented, q. e. d. 


*5 The number of the elements of the finite lattice L is indicated by O(L). 
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§ 2. Boolean ring operations 


In Corollary of Theorem 3 we have shown that among distributive 
lattices just the relatively complemented ones have the property that every 
congruence relation is determined by any congruence class of it. It is well 
known that the rings have the same property. We prove that this connection 
between the rings and relatively complemented distributive lattices is not 
accidental. We shall see: that any relatively complemented distributive lattice 
may be regarded as a Boolean ring, hence the validity of the above state- 
ment becomes very natural. 


DEFINITION 5. Let A be a set of equations on the distributive lattice L, 
containing a finite number of equations, parameters and the unknowns x, y 
and z. If A has a unique solution with respect to z for any fixed values of x 
and y in any homomorphic image of L, then we write z—x-+-y. If the oper- 
ation + satisfies the group axioms, then we speak of a group operation 
defined on the lattice L. If, furthermore, in a similar way (hat is, with an 
equation system, having unique solution in any homomorphic image of L) 
there is defined another operation denoted by - such that + and - satisfy 
the ring axioms, then we speak of a ring operation defined on the lattice L.* 


THEOREM 16. On the distributive lattice L one may define a Boolean 
ring operation if and only if L is relatively complemented.” All Boolean ring 


operations may be defined in the following way: 
Let a be a fixed element of L. Let x-y be equal to (x Ua)n(xUy)N(auy) 
and let x+-y be the relative complement of x-y in the interval [anxny, auUxuy}. 


Proor. First we prove that the operations defined in the Theorem are 
ring operations. Applying Theorem 14 we get that it suffices to prove in 


case of the lattice 2. 
In the lattice 2 the above operations may be given by the following 


tables: 


+/01 oe! 
fea0 204.0.) 0/00 
Ic lOiee ablalaOal 


26 The conditions of Definition 5 are satisfied if we define + and - only with 
the operations: join, meet, and taking the relative complement of an element in an interval. 

27 One can easily show that if we restrict ourselves to that special case in Defini- 
tion 5 in which the equations of A contain x and y only in the form xUy. and xy, then 
the existence of a ring operation characterizes not only the relative complementedness of 
a distributive lattice, but even the distributivity of the lattice. It immediately follows from 
the fact that with the above definition + is ambiguous in the lattices S and T. 
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Thus it is clear that we get Boolean ring operations. The case a=1 is the 
dual of the above. 

Now we prove that in a relatively complemented distributive lattice one 
cannot define other Boolean ring operations. First we prove this for finite 
lattices. If the lattice considered is 2, then the assertion is trivial, there is 
only two types of Boolean ring operations. Let us consider the Boolean 
algebra B, 2". A system of equations is uniquely solvable in a lattice 
which is a cardinal product of lattices if and only if the same is true 
in all of its cardinal-components. Thus the Boolean ring operations in B, 
are in a one-to-one correspondence with the Boolean ring operations of the 
n components. In all of its components two operations may be defined, thus 
in B, the number of different operations is 2” (these are all different from 
each other, for the zero elements are unequal). On the other hand, the con- 
struction in the Theorem gives also 2” different operations, for a may be 
chosen in 2” different ways and these are also different from each other, 
for the zeros of the rings (a) are unequal. Thus the definition of Theorem 16 
exhausts all the Boolean ring operations in the finite case. 

Now, let us turn to the general case. Let x, y and u,v be two pairs of 
elements of L, and B,,,, Bu,» will denote the finite Boolean algebras containing 
x,y resp. u,v and the parameters of the operations. B,, and B,,,. are finite, 
thus they have elements a and 6 which characterize the operations in B,,, and 
in B,,., respectively. We get a contradiction from a=+8, and this will com- 
plete the proof of the statement according to which all Boolean ring ope 
ations may be defined in the way described in the Theorem. Indeed, 
if a=- 6, then consider an element s common to &,, and to B,,. Now, 
s-+s—=a considered in B,,, and s+s=6 in B,,,, thus necessarily a=b. 

We shall use the following note: if JL is a distributive lattice and 
%1,++-,X €L, then there exists a finite sublattice ZL, of L, containing 
X%,+++,Xn. Indeed, by an obvious induction (n= 1 is trivial) if Z,-, is 
already constructed such that x,,...,Xn-1€L,-1, then let LZ, consist of Ln-1, 
from x, and from the elements of the form x,Nu and x,Uw where w runs 
over the elements of L,-1. 

At last we prove that if on the distributive lattice L one may define a 
Boolean ring operation, then L is relatively complemented. Let L,.,, bea finite 
sublattice of L which contains x, y and all the parameters. L,. y 1s a subdirect 
product of replicas of 2 and in 2 the operations are defined as in the 
Theorem, thus in L,,, the operations are defined by the definition of our 
Theorem too. From the fact that L,,, is closed under the operations + and - , 
it follows the relative complementedness of L,,, and in the same way the 
relative complementedness of L, q. e. d. 


(Received 2 January 1958) 
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UBER DIE METRISCHE THEORIE DER DIOPHANTISCHEN 
APPROXIMATION 


Von 
P. SZUSZ (Budapest) 
(Vorgelegt von P. Turdn) 


KHINTCHINE [1] bewies den tolgenden 


SATZ 1. Es sei f(x) eine positive, monoton abnehmende Funktion des 
Argumentes x. Dann hat die Ungleichung’ 


(1) jex|| <2 


fiir fast alle reellen « (d.h. fiir alle a, hichstens bis auf eine Menge vom 
Lebesgueschen Maf Null) héchstens endlich viele oder unendlich viele Lésungen 


mit natiirlichem x, je nachdem die Reihe = konvergiert oder divergiert. 
k=1 


Ist @ eine beliebige Irrationalzahl, so kann nach einem klassischen Satz 
von Hurwitz die Ungleichung 


(2) ||ex|| << —— = 


unendlich oft mit natiirlichem x erfiillt werden und die Konstante 5°” 1a8t 

sich im allgemeinen durch keine kleinere ersetzen. Nach KHINTCHINE [4] ist 

(2) auch dann mit natiirlichem x unendlich oft erfiillbar, wenn man in (2) 

\|ax|| durch ||@x— || ersetzt, wobei § eine beliebige reelle Zahl bedeutet. 
Es erhebt sich die Frage, was sich tiber die Ungleichung 

x 

3) jex—4] <2) 

aussagen l4Bt, wenn man eine Nullmenge in @ aufer Acht 1a8t. Der Ver- 

gleich des Hurwitzschen Satzes iiber die Ungleichung (2) mit dem Khintchi- 

neschen Analogon im inhomogenen Falle, d. h. mit dem Satz tiber die Lés- 

barkeit von ||jax—\| < ie mit natiirlichem x legt die Vermutung nahe, daB 

Bs 
die Behauptung des Khintchineschen Satzes 1 giiltig bleibt, wenn man. statt 
(1) die Ungleichung (3) betrachtet. 


1 ||.--|| bedeutet den Abstand der zwischen den Strichen stehenden Zahl von der 
ndchstbenachbarten ganzen Zahl. 
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Es ist mir gelungen, den Khintchineschen Beweis des Satzes 1 so zu 
modifizieren, dai er auch die Bestatigung der obigen Vermutung ergibt. 
AuBerdem zeige ich, daB sich im allgemeinen nichts aussprechen 148t, wenn 
man in (3) @ festlegt und nach einer fir fast alle 8 giltigen Behauptung 
fragt. Es werden genauer die folgenden beiden Satze bewiesen: 


Satz 2. Es sei f(x) eine monoton abnehmende Funktion. Ist dann 8 eine 
beliebige reelle Zahl, so hat die Ungleichung (3) fur fast alle « unendlich viele 
oder héchstens endlich viele Lésungen mit natiirlichem x, je nachdem die 


Reihe Se divergiert oder konvergiert. 
kot 


Satz 3. Ist g(x) eine mit x— co beliebig langsam gegen Null strebende 
Funktion, so existiert ein a derart, daB die Ungleichung 


(4) Crepes!) 


fiir fast alle B héchstens endlich viele Lésungen hat, d. h. es gilt fiir fast alle 
8 \lax—B\|= a fiir jedes ganze geniigend grofe x. 


Bevor ich zum Beweis dieser Satze iibergehe, mache ich einige Bemer- 
kungen. 


1. Frau VERA T. SOs verdanke ich die Bemerkung, daB die Behauptung 
des Satzes 3 nicht mehr giiltig bleibt, wenn unendlich oft g(x) >c ist, wobei 
c eine beliebig kleine positive Konstante bedeutet. 


2. Satz 2 ist im gewissen Sinne scharfer als ein Satz von CAssELs [7], 
S. 121. Dort wird der entsprechende Satz, allerdings auch fiir den mehr- | 
dimensionalen Fall nicht bei gegebenem 6 fiir fast alle @, sondern fiir fast 
alle Zahlenpaare (a, 8) (d. h. fiir alle Zahlenpaare (@,) hdchstens bis auf 
eine zweidimensionale Nullmenge) bewiesen. In diesem Falle braucht iiber 
die Monotonie von f(x) nichts vorausgesetzt zu werden. In unserem Satz 2 
laBt sich die Forderung der Monotonie von f(x) nicht ohne weiteres weg- 
lassen; sonst lassen sich Gegenbeispiele angeben. 


3. Es erhebt sich die Frage, ob die zu Satz 2 analoge Behauptung 
nicht auch im mehrdimensionalen Falle gilt, ahnlich zum homogenen Fall 
(vgl. KHINTCHINE [3]). Bisher ist mir nicht gelungen, diese Frage zu beant- 
worten. Ich hoffe, auf diese in einer spateren Arbeit zuriickkommen zu kdnnen. 


Im § 1 gebe ich eine Zusammenstellung derjenigen Bezeichnungen, die 


durchweg gebraucht werden, § 2 enthalt den Beweis des Satzes 2, § 3 den 
des Satzes 3. 
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§ 1 


In dieser Arbeit bezeichnen @ und @ stets reelle Zahlen. Ohne Be- 
schrankung der Allgemeinheit kann O<@<1, 0=<1 vorausgesetzt wer- 
den. Ferner wird @ als irrational angenommen. Es bezeichnen a,, a,... die 
Teilnenner der regelmaBigen Kettenbruchentwicklung der Zahl a: 


(1. 1) a =[0; a,, a, ...]. 
Es seien on die Naherungsbriiche von ¢, schon in irreduzibler Gestallt geschrie- 
ben, d. h. 


(1.2) [05 41, 4,...,a)—=2, (An B=1 (1 =1,2,...). 
Es wird j is 

(1. 3) B,a—A,—D, | (n=1,2,...) 

gesetzt. Bekanntlich gilt? 

(1.4) baat yeasts) 


sae By Cant Bu-1 
er ee eed | (N= 1,2;.,.). 


wobei 
Wegen Cn >Qm ist 


1 
(1. bs : 
(1.5) |Dm| < rane 
Ist z eine reelle Zahl, so bezeichnet [z] bzw. (z) den ganzen bzw. Bruch- 


teil von z. Es ist also 
(1. 6) z=[z]+@), 0=(@)<1. 


Ferner bedeutet, wie bereits erwdhnt, ||z|| den Abstand der reellen Zahl z 
von der nachstbenachbarten ganzem Zahl, es ist also 


(1.7) ||z|| = min ((z), (1—())). 
Ist E eine Lebesgue-meBbare Teilmenge des Intervalles (0,1), so bedeutet 
(1.8) u(E) 


das Lebesguesche Ma6 von E. 


§ 2. Beweis des Satzes 2 


Der Beweis des Satzes 2 verlauft parallel zum Khintchineschen Beweis 
des Satzes 1. Damit der einzige, aber sehr wesentliche Unterschied zwischen 
den beiden Beweisen hervorgehoben werden kann, méchte ich zundchst in 


2 Vgl. Perron [6], S. 33, Formel (3). 
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grofen Ziigen den Khintchineschen Beweis des Satzes 1 wiedergeben. Es sei. 
also zunachst 6= 0. 


Der Fall der Konvergenz von pach: kann im Falle @=0 und auch im 
k= 


inhomogenen Falle auf triviale Weise erledigt werden. Die Durchfiihrung dieser 
Uberlegung soll unterbleiben. (Vgl. z. B. KHINTCHINE [2], S. 75.) Im folgenden 


SS (k ; 
wird angenommen, dai pe oo ist. 


Der Khintchinesche Beweis von Satz 1 beruht auf folgenden drei Hilfs- 
satzen: 


HILFSSATZ 1 (F. BERNSTEIN [5]). /st C1, C:,... eine Folge positiver Zahlen 


mit a= oo, so gilt fiir fast alle « fiir unendlich viele n 
k=! 


1 
QAni1 = ’ 
Cn+1 
1 . 
oder, was wegen |\B.e|l= ge < ane dasselbe besagt, 
(2. 1) Brel] < wi 3 


Hier hat a,,a@,,... bzw. 8,,B,,... die Bedeutung (1.1) bzw. (1.2). Ist 
dagegen >'c, < 0%, so gilt (2.1) fiir fast alle @ fiir héchstens endlich viele a. 
k=1 


HILFSSATZ 2 (KHINTCHINE [1]). Es existiert eine numerische Konstante 
A derart, dap fiir fast alle « bis auf endlich viele n die Relation 


(2. 2) Bie 
gilt. 

Auer diesen beiden Hilfssatzen bendtigen wir noch den folgenden, fast 
trivialen 


p : 
HILFssATz 3.‘ Ist f(x) eine monoton abnehmende Funktion und r,,f,... 


eine monoton streng zunehmende Folge natiirlicher Zahlen mit r, =< K", wobei 


8 Wegen der spateren Anwendung miissen wir voraussetzen, daB C1), Co,... eine mono- 
ton abnehmende Folge ist. 


4 Kuintcuine [1] benutzt statt Hilfssatz 3 einen nur formell veschiedenen Hilfssatz, in 
o © 
: s(n x 
dem statt der Reihe pss. das Integral low dx auftritt. Hilfssatz 3 besagt im Wesent- 
n=) j 


. . . I 
lichen dasselbe und scheint mir anschaulicher zu sein. 
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K eine beliebige natiirliche Konstante = 2 bedeutet, so folgt aus der Diver- 
genz der Reihe se ie Divergenz der Reihe ~ f(r). 


Der ganz einfache BEwels: Es gilt wegen der Monotonie von F(x) und 
wegen 7, = k” 


S1O_F"S } LO) = Sie 


n=KN Mt J=N y=xi 


se (K—=1) S/K) = (K—1) Dir). 


DKK) — 


Aus pus oo folgt also Yin) = oo, 


Nun kann der Khintchinesche Satz 1 aus den Hilfssatzen 1—3 folgen- 
dermaBen gefolgert werden: 

Es sei K eine natiirliche Zahl, die gréfer ist als das A des Hilfssatzes 
2. Beschranken wir uns auf die Zahlen @ mit 


Backs. 


falls n geniigend groB ist, so bilden die auBer Acht gelassenen @ eine ..ull- 
menge. Man setze nun 


(2. 3) f(x) =f(K"’) fir K"’<x=Sk" (n=1,2,...). 


Dann ist natiirlich fiir alle @, die nicht derjenigen Nullmenge angehdren, fiir 
deren Elemente bei unendlich vielen n B, > kK” ist, 


(2. 4) F(Bn) = fi(Bn), 


falls n geniigend grof ist. Gehdrt @ nicht der obenerwdhnten Se Betis an, 


so folgt wegen Hilfssatz 3 aus bs tala): fin) _ = oo die Relation om; (B,) == 00,3 


n= 
die Ungleichung | B.a|| <2 < f i.) ist also wegen Hilfssatz 1 fiir fast 


alle «@ unendlich oft lésbar, ond bf ist auch die nichttriviale Behauptung 
des Khintchineschen Satzes bewiesen. 
wy 


Will man den Beweis der Aussage im Falle ss soo des 


ems | 
Khintchineschen Satzes 1 auf den inhomogenen Fall abertaten! so stellt man 
zunachst die Frage, wo die Voraussetzung, daf& es sich um ||@¢x|| und nicht 
um ||@x—l| (@ beliebig reell) handelt, ausgenutzt war. Man erkennt leicht, 
daB dies nur bei Hilfssatz 1 der Fall war. Der Khintchinesche Beweisgang 
laBt sich ndmlich. wortlich wiederholen, wenn man zu jedem § (0< #< 1) 
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und fiir fast alle @ eine Folge monoton streng zunehmender natiirlicher Zahlen 
Xa ike oe 
angeben kann, die folgendes erfiillen: 
a) Es existiert eine von @ unabhangige nattirliche Zahl K, fiir die bei 
jedem geniigend groBen n die Ungleichung 


(2. 5) Xn att 
gilt. 
b) Ist c,,c,... eine beliebige monoton abnehmende Folge mit diver- 
genter Summe, so gilt 
(2. 6) lex,—A|| < 
bei unendlich vielen n. 
Nun versuche ich, fiir fast jedes @ eine Zahlenfolge x,,x:,... zu kon- 


struieren, die (2.5) und (2.6) erfiillt. Habe ich dies erzielt, so bin ich nach 
dem Gesagten mit dem Beweis des Satzes 2 fertig. 


HILFSSATZ 4. Jst C,,Cy,... eine monoton abnehmende Folge positiver 
Zahlen mit > = oo und 8 eine beliebige Zahl mit O<8< 1, so gibt es 
k=1 
fiir fast alle « eine Zahlenfolge x,,x.,..., fiir die 


(2. 7) 2D wide cae 
und bei unendlich vielen n 
(2. 8) lex, — Al] < 


gilt. (Fiir die Bedeutung der B, s. (1. 2).) 


Aus (2.7) folgt wegen (2.2) die Relation (2.5) mit einer geeigneten 
natiirlichen, von @ unabhangigen Zahl K. (2.8) ist wegen (2.7) gleich- 
bedeutend mit (2.6), die Folge c,,c.,... wird dabei gedndert, geniigt aber 
ebenfalls den Voraussetzungen. Haben wir daher Hilfssatz 4 bewiesen, so ist 
der Beweis des Satzes 2 vollendet. 


BEWEIS DES HILFSSATZES 4. Es sei § eine gegebene Zahl, die nur der 
Beschrankung 
(2. 9) ORY a 
unterworfen ist. Ist @ eine Irrationalzahl, so gibt es immer eine natiirliche 
Zahl ny derart, dab 


(2. 10) 


healt esas: 
B, CPi ates 


gilt. Bekanntlich 14Bt sich fiir mp eine von @ unabhangige obere Schranke 
angeben. Im folgenden wird stets angenommen, daf (2. 10) gilt. 


falls n=n 
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Nehmen wir an, daB die ersten n Teilnenner von @ schon angegeben sind : 
(2. 11) @ =[03a,, a2,...,Qn,...]. 


Bekanntlich sind durch @,,@2,...,Q, die Zahlen A,,Ao,...,A, und 
B,, B;,..., B, vollig bestimmt und die Zahlen a, die (2. 11) geniigen, bilden 
Ay An+An-1 An+An-1 An : 

B, < & = re oder ASTOR Weer = = B.” je nachdem n 


gerade oder ungerade ist. Es ist ferner bekannt,® daB @ eine Darstellung der 
Gestalt 


ein Intervall 


An , (—1)"9 
212 ¢= 
2) ed Bi, 
zulaBt, wobei # eine positive Zahl mit 
B, 
(2213) Ue an 


ist. Das durch (2.13) definierte Intervall sei mit J bezeichnet. Offenbar gilt 
5 <H(3)< 1. Durchlauft 9 das Intervall 3, so durchlauft @ das Intervall 


oe : pete |, das wir nach KHiNTCHINE [2] ein Intervall vom Rang n 
nennen wollen. Ein Intervall vom Rang n sei mit J, bezeichnet. Falls es 
nétig ist, die Abhangigkeit von den Zahlen a,,a,..., @, besonders hervor- 
zuheben, so wird - 

(2. 14) © h=4 (aaj a,) 


gesetzt. Bekanntlich gilt 
ER eT EET Cis eee a (sa 
k=1 


Da bekanntlich (A,,B,)=1 ist, sind die Zahlen (4: x) (X22 56; 


Digs ly.., 30n—1) in irgendeiner Reihenfolge gleich den Zahlen 
lh a; ee B,, 
Xn (2B, S Xn <3Bn) und eine natiirliche Zahl k, (3=k,n=B,—3) derart, dab 


ose—(#x)=0-F< E> falls a gerade, 


; wegen (2. 10) existiert daher genau eine natiirliche Zahl 


os(#x)—0—F—8<z. falls nm ungerade 


5 Vgl. Perron [6], S. 39. - 
6 J bedentet die mengentheoretische Vereinigung, 1) den Durchschnitt. 
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Es sei nun ¢,,,... die im Hilfssatz 4 auftretende monoton abnehmende 
Folge positiver Zahlen mit divergenter Summe. Es bezeichne E(@;, a, fd.) Gal 
die Menge der Zahlen @ € /(a;, 2, ..-,@n) fiir die 


(2. 16) |@—(ex,)| > 


ist, E, die Vereinigungsmenge der gee - cps falis @,,@),...,@, Von- 
einander unabhangig alle natiirlichen Zahlen durchlaufen, ferner bezeichne. 


(2. 17) Em = A Ei. 
Natiirlich gilt Ex,,—E£,. Es wird gezeigt, daB 
(2. 18) u(Enel eel Peete 
ks 
ot die a 
Ist (2. 18) bewiesen, so ist wegen der Monotonie von c,,@,... und wegen 


> ce, =. unser Hilfssatz 4 bewiesen, denn das Produkt auf der rechten 
k=!1 


Seite von (2.18) kann durch Wahl geniigend groBer Zahl m_ beliebig klein 
gemacht werden. 


Setzt man in (@x,) statt @ den Wert — - cia ap necd Lid eee , so erhalt man mit 
Riicksicht auf (2. 10) 5 cS 
(ex) = (Fx + —1)" =) + Kn 4 ANF x0 
B, 
Hieraus folgt wegen (2. 15) 
k Ix 
2.19 p— AaXn —1)( s— — > a ‘), 
(2. 19) (ex) =(—1) B. B. 
wobei # das durch (2.13) definierte Intervall 3 durchlaufen kann. Wegen 
o By 
<BoOB ry Hl. Ps ae oe Ve 
durchlauft (@x,) ein Intervall, dessen Lange nicht kleiner als xr und nicht — 
oe 
gréBer als B. ist. Da 4 ris, nimmt der Ausdruck (2. 19) auch den 


Wert O an. Nun bestimme ich diejenigen 4, fiir die 
(2. 20) \@—(ex,)| < 


7 Fiir die Bedeutung von «(...) vgl. (1. 8). 
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gilt. Wegen (2.19) ist (2.20) aquivalent mit 


kn F Ca+i 
B— 7 | oon < = ’ 
| B.| B; B,, 
also 
Cn+1 Kn IXn Cn+1 
ee s— pee sa : 
B, | iP Pa aie 2 
woraus 


B,, i 
<* (|BuB—ky| Cust) < 9 < Fo (|B, 8—Ks| bred = 


sein muB, 


folgt. Da wegen der Definition von & jedenfalls 0< #< 5. 
> Bat Bn-1 


ist (2. 20) dquivalent mit 


max (0, 2 5° (|B. b— kal Cnn | << 
(2. 21) 


=< 37. min Fee —— "(Bae — Ve +m}. 


B, + Be 
Nun zeige ich ftir Cn41 = + (was ohne Beschrankung der Allgemeinheit an- 


genommen werden darf) 


B,, 


Bo Ee Battal +0451))— 


(2. 22) ye | 


— max (0, 2 — (|B, b— k,,|— —cn)) 2 ae 


(2. 22) kann Penden ben eingesehen werden: wegen (2. 15) ist 
|B, 8—k,| = 1 Ist 


max (o fs (|B.B—kn a) = 0, 


so ist 
eae = Cnt = 3 
und folglich auch |B, 8—k,,| =o . Daher gilt wegen der Definition von x, 
B,, 
x, (|B B— kn | + Cn41) = a 
andererseits ist ee ae also ist im Falle |B,6—n| SCnyi die linke 
Bit Bn-1 ok a 


Seite der Ungleichung (2. 22) nicht kleiner als ott Gilt |B, P—Kn| > Cn, 
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so ist i B 
B 1] n n 
Pu awe —"(|Bnb—Kn|+¢ns1) > — |BnB—ka| 
Bor Boe ee: x é I+ +) Xn i 


und BoB p—k,| a ae die linke Seite von (2. 22) ist gréfer als 
Xn 


Cn41 


Bn ALB, 
x, (| Bab —Kn|—(|BnB— kn |— Cns1)) a x," > 3 . 


(2. 22) ist also bewiesen. Ich erinnere noch einmal daran, daB % das Intervall 
3 durchlauft. Jedenfalls ist #<1. Damit (2.20) gilt, muB daher aus jedem 
Intervall n-ten Ranges (was durch @ durchlaufen wird, wenn # das Intervall 
Cn4+l 

3 . . 
nur diejenigen @ betrachten, fiir die (2.16) gilt. Daher besagt die Uglei- 


-fache Teil gestrichen werden, wenn wir 


3 durchlauft) mindestens der 


cst) fache von 


chung (2.22), daB u(E(a,,a),...,@n)) héchstens das (:— 


& (I(a,a,,...,a,)) ist.* Da (2.22) unabhangig von der speziellen Wahl der 
M,Q,...,Qn giiltig ist und alle Intervalle n-ten Ranges paarweise fremd sind, 
folgt hieraus weiter 


(2. 23) # (Ein) =e (Ex) = 1— Sc 1 


die Ungleichung (2. 19) ist also fiir EX, 2—=m bewiesen. Wir fiihren nun 
eine vollstandige Induktion beziiglich m durch. 

Es ist zweckmaBig, anstatt E,,, ahnlich, aber einfacher konstruierte 
Mengen E,,m zu betrachten, die die Eigenschaft haben, daB stets 
(2. 24) Ean SES 
ist. Natiirlich wird es geniigen, (2.18) mit E anstatt E* zu beweisen. 

Es ist Ex, E,. Wir bildeten die Durchschnitte 

(Gy, Gsyese; Caz) 0 ee (k= 1,2,...) 

und strichen aus diesen die Zahlen @ mit (2. 20). So erhielten wir E,E,4;—= 
= Eyx,n41- Durch Fortsetzung dieses Verfahrens erhielten wir Ena: Entel 
steht dadurch, daB man nicht aus jedem /(a,, dy, . . +» Am-1, kK) Enm-1 die Zahlen 
@ mit (2. 20) streicht, sondern nur aus jenen IG, sare se Watt, K) die Zahlen 
mit (2.20) ausschlieBt, die ganz in E,,m-1 enthalten sind. E,, ist also gleich 
Exin- Enn+1 erhalt man so, daB man von denjenigen Intervallen /(a,, a, ..., Qn, k), 


die ganz in E,,, enthalten sind, die Zahlen @ mit (2.20) ausschlieBt usw. 
(2. 24) ist offenbar erfiillt. 


* Fir die Definition von E(a,, 2, ...,4,) bzw. 1(d,, dy,...,4n) vgl. (2. 14) bzw. (2. 16). . 


UBER DIE METRISCHE THEORIE DER DIOPHANTISCHEN APPROXIMATION 187 
Nun zeige ich (2. 18) mit E£,,,, statt Exim, d.h. 
(2. 25) peaycord [1 — et), 


0s SE 
bee + ee, 


Die Relation (2.25) ist, wie bereits gesehen, fiir m—n richtig. Nehmen wir 
an, sie ist bis m bewiesen. Nun ist trivialerweise 
(2. 26) Ein, in — Ln,m a U I(a,, Ay, 0223 Am+1)- 
Oy, yy 0+ Am yy =1 
Nun entsteht Ex,m42 dadurch, daB man aus sdmtlichen Intervallen 
I(a;,-+-)4m+i), die ganz in E,,» enthalten sind, die Zahlen @ mit (2. 20) 
streicht und dann von allen Intervallen /(a,,...,@ms2), von welchen noch 
keine Zahlen ausgeschlossen wurden, die Zahlen @ mit (2.20) ausschlieBt. 
Es seien a@),...,@m gegeben und wir betrachten das Ma der Menge 
eae a] I(a,, seey “bet : 


Bei jedem Ausschliefen von Zahlen mit (1. 9) mub nach (2. 22) ein Intérvall 
von einer Lange ausgeschlossen werden, die nicht kleiner als 


Cm+2 m 

Sr W(M(@is +1 On, D) baw. : 2 (1(ay, --+» Ams bs 1) 

ist. Daher ist 

1 (En,ms2 0 1(dy, -. +, Am)) = H(Enmi2 A U Hdinsess tins LT ))m 
ed | 


(2. 27) 
PU ( Es (l UttGi; +. -; Om, tT) + [ — nit) (En OM (as, Gast?) 


wobei U, iiber diejenigen Intervalle (m-2)-ten Ranges zu erstrecken ist, fiir 
die En,» A Maso ., Gms f AIG, cod Gn i) (r=, 2,...) ist, und U, tiber 
die Ubrigen. 
Im folgenden wird das Mab 
tl En 1) Usl(dy, «< +9 Om, K, 1) 

nach unten abgeschatzt. Es sei I(a,,.--,@m) ein beliebiges Intervall vom 
Rang m. Wegen der Konstruktion von E,,m entsteht der Durchschnitt 
Fie wf 1(G,5++<7 Am) aus I(a,,.--,4m), indem daraus genau ein Teilintervall 


ausgeschlossen wurde. Ist also der Durchschnitt 
| En ati T (Gis 8 On) 


nicht leer, so besteht er aus hdchstens zwei fremden Intervallen, die, falls 
beide vorhanden sind, die Endpunkte von I(a,,-.-,@m) enthalten. Besteht 
EnmQ1(a,,..+, @m) aus einem einzigen nichtleeren Intervall, so enthalt dieses 


den einen Endpunkt von /(a,,..., @mn). 
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Geht man von EnmMI(d;,-.-,@m) auf ExmiiN1(@;,..-,@m) tiber, so hat 
man folgendermafen zu verfahren: Man mu8 die Endpunkte der Intervalle 
m-+1-ten Ranges (die /(a,,@,...,@n) genau einfach tiberdecken) 

[(Q\5 95; Gao) (fasisZ 2) 

auf der Zahlengeraden markieren. Von denjenigen dieser Intervalle, die ganz 
in Enmf/(aQ),.--,Qm) enthalten sind, miissen die @ mit (2.20) gestrichen 
werden. Falls aus einem /(a,,..., @m, 1) bei dem Ubergang auf Eyn,m+1  1(a;,---,l) 
iiberhaupt etwas gestrichen wird, so muB wegen (2.22) mindestens das 


= -fache von /(a,,...,Qm,/) ausgeschlossen werden. Da nun 
cet (Yl ee eas 


aus hdchstens zwei disjunkten Intervallen besteht, die (falls sie nicht leer 
sind) die Endpunkte von /(a,,...,@m) enthalten, gibt es héchstens zwei von 
den Intervallen /(a,,...,@n, 1), die einerseits mit ExymN/(a,,...,Qm) einen 
nichtleeren gemeinsamen Teil haben, andererseits nicht ganz in Ey, mM /(@i,.--,@m) 
enthalten sind; mit anderen Worten, es gibt héchstens zwei /(a,,...; Qm,/), die 
mit En m A /(a,,...,@m) einen nichtleeren gemeinsamen Teil haben und von denen 
beim Ubergang von EnmNJ(a,,,--,@m) auf E,miiAl(a,,...,@m) keine Zah- 
len gestrichen werden miissen. 
Wir setzen fiir einen Augenblick 


(2. 28) ts UR = By C107; sh xx Gn), 
wobei L das Intervall am linken Ende von E,,,,9/(a,,...,@m), R dasjenige 
am rechten Ende von Fim /(a,,...,@m) bedeutet. Nehmen wir an, m ist 


ungerade und L nicht leer. Da die Endpunkte der /(a,,..., @m,1) (/=1, 2,...) 
die Zahlen 


Aml+Am-1 

Bl + Bm-1 
sind, die mit /-+ © monoton abnehmend gegen a streben, folgt die Tat- 
sache, daB es héchstens ein /(a,,...,@m, 1) mit nichtleerem L 9 Ka, ..., am, 2) 


und Ln /(a,,..., An, 1) += 1(a,,...,Qm, 1) geben kann. Da durch eine ganz 
einfache Rechnung die Ungleichung 


-_ HU (a,..-) Am, 0) 
(2. 29) eae ae Tie 
bestatigt werden kann, gilt 


(2.30) WL NUM, ...,dm,D) > 2 H(LN U M(as5.++5msl)) = w(L), 
| 


wobei U, iiber diejenigen /(a,,...,@m,/) zu erstrecken ist, die ganz in L 
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enthalten sind. Man erhadlt dasselbe mit Intervallen m-+2-ten Ranges 
I(a,,...,Qm,1,r) fiir R, wobei R durch (2. 28) definiert ist. So ergibt sich 


PUR HUGH ..., day en) = -H(R), 


also, da man die /(a,,...,@m,/) in (2.30) noch weiter in Intervalle m+ 2-ten 
Ranges unterteilen kann und wegen (2. 28), 
(2. 31) PLES al U,l(a 9. @en8 y Qmy, L, r)) Ee + ts(Enn). 


Hieraus folgt wieder, wegen (2. 28), 
2 
oe nN Uil(a, 6 LAPtD An ’ L r)) = 3 HCEn,m) 
(U, bzw. U, bedeuten dasselbe wie in (2. 27)), also wegen (2. 27) 


9 


Fiir gerades m erhalt man dasselbe; es tauschen nur bei der Rechnung L 
und R die Rolle. 

Nun lasse man die Zahlen a,,a@,...,@n Vvoneinander unabhangig alle 
nattirlichen Zahlen durchlaufen. Da alle Intervalle m-ten Ranges das Intervall 
(0,1) genau einfach tiberdecken, erhalten wir 


Bey (Ex sede d (GiyisvyGa)) < [ ees JE pel fe erp ttn); 


(2. 33) (Emmis) <(1— 2 | (En) 


womit (2.25) wegen der Induktionsvoraussetzung bewiesen ist. Damit ist 
wegen (2.24) auch (2.18), also auch unser Satz 2 bewiesen. 


§ 3. Beweis des Satzes 3 


Der Beweis des Satzes 3 geschieht ebenfalls mittels der Kettenbruch- 
lehre. Fiir die Bezeichnungen vgl. § 1. 

HILFSSATZ 5. Es sei 6,,6,,... eine Folge positiver Zahlen mit konver- 
genter Summe. Dann ist die Menge der Zahlen 6 (0=8<\1), fiir die fiir 
unendlich viele n mit einem natiirlichen x (1 =x< B,) 


(3.1) ax—< F 


gilt, eine Nullmenge. 


BEwEIs. Es bezeichne (bei gegebenem n) E,, die Menge der Zahlen @ 


mit (3.1). Offenbar gilt 
U(En) < 26n. 
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Falls >'5, konvergiert, kann keine Menge vom positiven Ma8 in 


n=] 


Alea enthalten sein, wobei {w(m)} eine beliebige unendliche Teilfolge 


der natiirlichen Zahlenfolge bedeutet. 

HILFSSATz 6. Man markiere im JIntervall (0,1) die Punkte (ex) 
(x =1,2,...,B,—1). Diese Punkte zerlegen (0,1) in B, Teilintervalle, die 
mit I,,; (n=1,2,...; j=1,2,..., Bn) bezeichnet werden médgen. Dann gilt 
(3-2) Bs) >| Darl 
wobei D, (k= 1,2,...) durch (1.3) definiert ist. 

(3. 2) ist eine unmittelbare Folgerung aus dem Géesetz der besten 
Naherung der Kettenbruchlehre (vgl. PERRON [6], S. 44). 

HILFSSATZ 7. Es bezeichnen k; bzw. 1; diejenigen natiirlichen Zahlen un- 
terhalb B,, fiir die (k;«) der linke, (la) der rechte Endpunkt von I,,; ist, 
welches im vorigen Hilfssatz definiert wurde. (Der rechte Endpunkt von Tn, By 
ist der Punkt 1, der sich nicht in der Gestalt (ax) (x natiirlich) schreiben 
lapt ; ferner ist k,=0.) 

Betrachten wir dann nicht nur die Punkte 

(@x) (x= 1,2,..., B,—1), 
sondern auch die Punkte 
(ax) (x= 1,2,..., Buii—l), 
so liegen von den Punkten (ax) im Inneren des Intervalls I,,; genau die Punkte 
(Ai + qBn)@) (q aaa 1, 2, eoheig Qn+1) 
oder ; 
(G+ qB,)a@) (q ae iF 2, teey Ans1), 
Je nachdem n gerade oder ungerade ist; ist k; bzw. 1; nicht kleiner als By-1, 
so entfullt das letzte Glied in den obigen Folgen. 


Der Beweis folgt sofort aus Hilfssatz 6 und aus der durch eine einfache 
Umformung zu bestatigenden Tatsache, daB fir m< Biwi, m= qB,+s, s=1, 
die Relation "i 


(ma) =(se)+qD, 
gilt. 
HILFssaTz 8. Es sei 8 eine Zahl, fiir die 
30d fox Dn 
(3.3) jex—s|| = 


gilt, falls x eine natiirliche Zahl ist, die kleiner als B,, ist. Betrachtet man 
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dann die Zahlen ax’ mit natiirlichem x’ (1 =x’ < Bny1), so gilt fiir jede Zahl 
x’ mit 
, On 
(3.4) lex’ —B|< a5 
die Ungleichung 


(3.5) ee <x < Bia. 


BEMERKUNG. Ist >) 0, < co, so bilden die Zahlen 8, die fiir unendlich 
k=1 


viele n die Relation ||ax—|| < oe (1=x<8,) erfiillen, eine Nullmenge ; 
(3. 3) ist also fiir fast alle @ und fiir jedes geniigend groBe n erfiillt, falls 
By konvergiert. Diese Tatsache wird stark ausgenutzt werden. 

k=1 


BewEls. Es bezeichne j’ die Zahl, fiir die /,,; @ enthalt. Wir diirfen 
ohne Beschrankung der Allgemeinheit annehmen, daB O<f<1 gilt und 
dann n so grof wahlen, dab 2=/’ < B, gilt. 

VoraussetzungsgemaB gilt 

Dn 

(3. 6) se 
\(Ge)—B|= Ra 
Wegen Hilfssatz 7 haben die Zahlen x’ (1=x'< Bn), fiir die (@x’) im 
Intervall /,,; liegen, die Gestalt k;-+q8, oder J; -+qB,, je nachdem n gerade 
oder ungerade ist. Es gilf 

| (ex)—8=(Ka)—8+qD,, 

(2x)—B=(a)—8+ qD,, 

falls n ungerade ist. Damit (3. 4) gilt, muB wegen (3.6) jedenfalls 


bn x, On Buys Als 3 
RAY YER, age NE, OE ne 


falls n gerade, 


sein. Daher gilt 
bn 


2 


womit Hilfssatz 8 bewiesen ist. 
Nun kommen wir rasch zum Ziel. Wir wahlen a so, daS ihre Ketten- 
bruchnenner so schnell anwachsen, da stets 


(3.7) bn Bri > 4Ba 
gilt. 


b 
Qn+1 B, > a Brus ; 


oe 4 
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Ist n gegeben, so teilen wir die natiirlichen x mit B,1=x<B, in 
zwei Klassen, je nachdem 


(3. 8) Beeps eee, 
oder 
(3. 9) Sat B, =x < Bn 
gilt. 


Gilt nun fiir alle natiirlichen x’ mit B,»o= x’ <B,-; 


| ” by -1 

|| ex” — B]| ae : 
was nach Hilfssatz 5 fiir fast alle @ bei geniigend groSem n der Fall ist, 
so ist fiir alle x mit (3.8) nach Hilfssatz 8 


De ~s bn-1 
4 2 hPa 
Gilt (3.9), so folgt, nach Hilfssatz 5, fiir fast alle ¢ 
3 We ea yal 

{diel 1) lex—Bl| > p- aE Be eT eo 
Daher gilt in jedem Falle fiir fast alle @ (3.11), fiir geniigend grofes n und 
Xe Bas 

Es sei nun g(x) eine beliebig langsam gegen Null strebende Funktion. 
Wachsen die Kettenbruchnenner a,,a,,... von «@ so stark an, dai (3.7) 


(3. 10) lex—pl|> 


erfiillt ist und die Reihe > (g(B,))'” konvergiert, so folgt hieraus, daB die 
Kok 
Ungleichung 
pe 
jax—al| < & 
fiir fast alle @ héchstens endlich viele Lésungen besitzt. 
Zum SchluB méchte ich Herrn J. SuRANy! meinen besten Dank fir 


manche Verbesserungsvorschlage und fiir seine wertvolle Hilfe bei der Ab- 
fassung dieser Arbeit aussprechen. 
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(Eingegangen am 3. Januar 1958.) 
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NOTES ON INTERPOLATION. III 
(CONVERGENCE) 


By 
J. BALAZS (Budapest) and P. TURAN (Budapest), member of the Academy 


§ 1. Introduction 


1. In this paper as well as in the previous two of this series! 2 we 
are dealing with the investigation of what we call as (0,2)-interpolation which 
is in some respects thoroughly different from other sorts of interpolation 
studied sofar. Given n points in [—1, + 1] 


Meas Ha 


usually only that sort of interpolation was considered when the consecutive 
derivatives were prescribed for the f,’s. By (0,2)-interpolation we mean the 
investigation of those polynomials of degree = 2n—1. whose function-values 
and values of the second derivatives at the ¢,’s (yv—1,2,...,m) are pre- 
scribed. It turned out in |? that the behaviour of these polynomials can be 
studied most conveniently in the case when we choose as the “fundamental 
points” ¢, of the (0,2)-interpolation the zeros x, (vy 1,2,...,2) of the 
polynomial J7,,(x) where 


x 


(1.1.1) I, (x)= —n(n—1) | Paa(Qdt=(1—2*) Pax) 


and P,(x) stands throughout this paper for the k** Legendre polynomial with 
the normalisation 


i. 1; 2) P,(1) = 1. 
Then we have — 
(1. 1. 3) P= X1 > Xe > +++ > Xn-1 > Xe —1. 


We shall use also in the present paper exclusively thts choice of the t,’s. It 
turned out! that such interpolatory polynomials exist if and only if is even. 


1 J. Surdny1 and P. Turdn, Notes on interpolation. | (On some interpolatorical pro- 
perties of the ultraspherical polynomials), Acta Math. Acad. Sci. Hung., 6 (1955), pp. 
67—79. 

2 J. Batézs and P. Turdn, Notes on interpolation. II (Explicit formulae), Acta Math. 
Acad. Sci. Hung., 8 (1957), pp. 201—215. 
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Throughout this paper let 

(1.1.4): n=2k24. 

Denoting by R,(x) the polynomial of degree =2n—1 with 
R, (Xv) = @, = prescribed, 


(1.1.5) Ri(xy) = By = prescribed, 
we have obviously 
(1.1.6) R(X) = Derr(x) + 2 BrOr(2), 


where the polynomials r,(x) and e,(x), the so-called fundamental functions 
of the first and second kind, are of degree =(2n—1), uniquely determined’ 
by the conditions 


1 ‘for j=y?, f 
(1.1.7) rey=}9 for Ane (s/=n),- 
re 0g) =0) for: fax 1 27.i, 2 
and 
e{x)==0 for j=l, 2.2. 6.M; 
(1. 1. 8) 1 for j=», 


esxy—=} for jy (1 mh eS 

respectively. 
2. We now consider the seguence of points 

(le 2: 1)” tax > Ag os Aad a ot hee ee (n= 4, 6,8, ..., 2K, came 


where x,,’s stand* for the zeros of //,(x). Then forming the interpolatory 
polynomials (1.1.5) and (1.1.6) for each n=2k we shall write the funda- 
mental functions (1. 1.7) and (1. 1. 8) as 


Tyn(x) and Ovn(X), 


respectively. Let now f(x) be defined for [—1, + 1]; we consider the sequence 
of polynomials 


(1.2°2) R,(x,f) = 2, F (Xn) Fon(X) + =, Byn Qrn(X) 
with arbitrary numbers ,,. We shall prove the following 


_ THEOREM I. Let f(x) be continuously derivable in [—1, +1] with the 
continuity modul (0) of f’(x) such that 


(C23 sped 


0 


* The notation (1. 1.3) of the zeros I7,(x) was more suitable when n was fixed 
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exist. Supposing that for arbitrary small e=>0O we have for n>n)(e) and 
e—1,2,...,2 
(1. 2. 4) |Fn| = en, 
the sequence R,(x,f) converges to f(x) uniformly in [—1, +1]. 

In order to show that Theorem | is to a certain extent best-possible, 
we state the 


THEOREM II. /f ¢ is an arbitrary small positive number, then there is a 
function F(x) belonging to the class Lip (1—e) such that the polynomials 
R,(x, F) (even in the case By»—=O0O) are unbounded for x —0. 


3. The theory of the interpolation abounds in convergence proofs. The 
essentially new feature of the present one — apart from the fact that this is 
according to our knowledge the first convergence theorem concerning 
“lacunary” interpolation process — is caused by the fact that being forced to 
use rational approximation polynomials of increasing degree we need a 
good upper bound for its second derivative in the whole [—1, +1]. 
Approximating periodical functions by trigonometrical polynomials the first 
result in this direction is due to L. FEJER* who, when proving that if the 
Fourier series of an everywhere continuous function, having an everywhere 
continuous conjugate, converges umiformly everywhere, then so does the 
Fourier series of the conjugate function, used the remark that if the sequence 
Z,(F) (n=1,2,...) of trigonometrical polynomials of order n converges 
uniformly to a (continuous) g(#), then we have 2,(.%)—o(n) (and thus 
7 (%)=0(n’)). This result was generalized by G. FREUD’ in his study on the 
asymptotical representation of general orthogonal polynomials and asserts that if® 


|z.(A)—e(P)| Sane (0<«<)), 


then . 

(1. 3. 1) | tn(F)| S cn 
and in the case e=—1 

im. 3. 2) |7tn(F)| = cs log n 


(and thus 7,/(+) = O(n log n)). Even from 
1 
24(9)—e(9)|=0(4| 
it follows 7;,(%) =o (n log n) only and this is not enough for our purposes; 
moreover, new difficulties arise in the rational case near the points x= + 1. 


4 L. Feyér, Uber konjugierte trigonometrische Reihen, Crelle Journ., 144 (1914), pp. 48—56. 

5 See his unpublished thesis. For (1.3.1) and (1.3.2) simpler proofs have been 
piven by the second of us. 

6 In what follows c,,¢:,... denote numerical positive constants; if some of them 
depends on some parameters, then this will be explicitly stated. 
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Therefore we have to make use of a different approach using special rational 
approximation polynomials to overcome this difficulty. 

Since — after having once Lemma 4.4 — the proof of Theorem II 
follows closely a construction given in a paper of P. ErDOs and P. TURAN 
(On the role of the Lebesgue functions in the theory of the Lagrange inter- 
polation, Acta Math. Acad. Sci. Hung., 6 (1955), pp. 47—66), we shall omit 
the details. 


§ 2. Preliminaries 


1. The explicit form of the fundamental functions r,(x) and e,(x) what 
we have found in * is the following: 


tzo nel) a) —— age ae +4 Pcl, 
(2.1.2) (= GeO |-14 LP 
and’ for 2S 7=n—1 ' 
ig IT, (x) ) 2 Pe t 
Or) ce 4n?(n—1)?P,-1(xy)? jx | 0 ris 


(2. 1. 3) z 
2) ( Pra(t) l 
+(1—x, jasc 2 Pe: ABT a | 

Serial Scala ar ertis tha Fs SE | “| 
Further, if 
(2. 1. 4) i) tetas 

() IT .(Xv)(x—x,) 

stand for the fundamental functions of the Lagrange interpolation based on 
our x,-points in (1.1.3), then we have 


3 en eae 
am hOP—* h(x) + 


(v=1,2,...,n) 


fii(x)= 


(2. 1.5) 5 
1 i \ l 
+ Lis + gaacay 0) |t+ 5 Pl 
Pet ee a Sy ; 
(2. 1.6) Fn) =F bat bn) Ea) + 
5 1 1 
+le+eaeep) TET 9) I~ Pn-1(X) 


7 (1.1.1) gives that the integrand of (2. 1.3) is a polynomial. 


8 Since according to a remark of Feyér I’ == i i i 
>otguatalaieseaau JER [)(x,)=0, the integrand in (2. 1.7) 1s @ 
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and fo’? 2=v=n—1 


r(x) =1,(x2— mi J 3 a ri + | FEO) t+ 
3(1 Saya 


2. These forms seem to us the most symmetrical ones for the funda- 
mental functions. In this paper, however, we shall need some other represen- 
tations more suitable for our purposes. Lemma 4.1 and Lemma 6.1 of the 
paper’ give for v= 2, 3,...,n—l 


(2*1:7) 


I1,(x) * Pt) 
Pan OPS) |) fa 
(29201) = | : | 
+ P,. «9 (— jae Wa, 2 SST 
3 1 
ia 1—x, 4 (1 XP Xe) 
and 
IT, (x) * Py s(t) 
67(x) = say Ea ETD SN pars dé-+ 
(2. px 2) 2 IT (Xr) Pa“ (Xr) | t—Xx, 


LE 2, +t )-( eta) 
+ Pa-1(%) I—$x8 3 (1) Pai) =x, (127) Pai (&) 


respectively. From (2.1.7) we evidently have for Yum 23s...) ft—l 


T(x I; (t) L(t) P,1(x) 
r(x) =1,(x— = je tr2[ mo irae once) 


2LIn (Xe) t—X, 
and 
ge edn) L(t) yy Lt) gy ne gilt Pt-u(x) 
Be Beales, 211; (Xv) [Hoa z ee rea 3x) Pe i (ean) 


According to Lemma 9.1 of * we have 


1 
L(t) 1 
dt=— ——_,——_= 
J t—x, (1—x5) Pas (X) 


-1 
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which gives 


IT,,(x) L(t) Pr-1(x) 1 
OLS Ms j rapek ae exe hd} ROT 


and 
1 Hdx) | f bt) lp Pa) \5 tet eee 
abdianatey & TTX) | (ise es vilex eee esr as 


Applying partial integration the term /,(x)* will obviously be cancelled and 
we obtain, using /,(+1)=0, in the case x <x, the form 


DU ler, att ane ron) 1 
ae ait a ug 6 esas. 


IT, (x) 
(2: 2. 5)6- b= T1s(x,) | 


and in the case x,<x 
_ IT, (x) 
~ (Xv) 


ap Ais t+(5— z aa 1 
eee om 2 6 |) (—2) Pail’ 


Using (2.1.4) and (1.1. i we obtain the forms, which fit the best to our 
present purposes valid for v = 2, 3,...,2—1, 


1, (x) = (x—xy) by (x) { eee dt+ 


Cred die tee (x) IT, (x) 

. Feria 6 | een perrens Ot ee 
and . : 

r,(X) = (x—x»)l,(x) i ae dt+ 
(2. 2. 6) ' e s 
1 P,- 1(Xx n(x 

n(n—1) te ‘5 si 6 ea a ne 

respectively. 


Owing to the uniqueness theorem in ’ we have for an arbitrary poly- 
nomial V(x) of degree = 2n—1 


(2.2.1) p> V(x)n(x) +S V"Gs)e@) = VOX. 


9 See e. g. G. Szeaé, Orthogonal Penny Amer. Math. Soc. Coll. Publ. (New 
York, 1939), p. 167, formula (7. 33. 8). 
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_ 3. We shall use some well-known facts about Legendre polynomials. 
For —1=x=-+1 we have® 


(2.3.1) [Pa(x)| = TY 
and S. BERNSTEIN’s inequalities *° 

(2.3.2) Pacis | ae # Lion 
forn=4 be ees 
(2. 3. 3) (I—x*)"*| Pis(x)| = 2a, 


(2.3. 4) |1,(x) | < / En. 


Further, for —1=x=-+1 we need” 


(2. 3.5) |Pn(x)| <1, 

the equation ” 

(2. 3. 6) (1—x’) Pr (x) — 2.x Pz, (x) + m(m + 1) P(x) = 0, 
and finally ’* the estimation 

(2. 3.7) Foy (|e eee Le ae Ty 


2-4-6...(a—2)~ 3 
We shall also repeatedly use MARKOV’s and S. BERNSTEIN’s inequalities, 
according to which for a polynomial g(x).of degree =m and real coeffi- 
cients we have for —1=x=+1 


(2. 3. 8) lg"@)| Sm max |g(x)| 
and iy 
(2. 3.9) |e’()| = —— ax |g(x)|, 


Vi-faseet 
respectively. 
Further, for the fundamental functions /;(x) from (2.1.4) we have™ 


(2. 3. 10) Div > 1 (xvas les pel ele erg, ofc= 1y2,%.., 1). 
v=1 : 


10 §. BernsTEIN, Sur les polynédmes orthogonaux relatifs 4 un segment fini. Il, Journ. 
Math. pures et appl., 10 (1931), pp. 219—286. 

11 See Szec6, |. c., p. 159, formula (7. 21. 1). 

12 See Szea6, |. c., p. 59, formula (4. 2. 1), 

18 See Szea6, 1. c., p. 161, formula (7.3. 11). 

14 L, Feyér, Bestimmung derjenigen Abszissen eines Intervalles, fiir welche die Quad- 
ratsumme der Grundfunktionen der Lagrangeschen Interpolation im Intervalle ein méglichst 
kleines Maximum besitzt, Annali della Sc. Norm. Sup. di Pisa (2), 1 (1932), pp. 3—16. 
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4. An important role will be played by 


LEMMA 2.1. For the relative extrema of Py-i(x) in O<x<1 (i.e. for 
the numbers |Pr-1(Xy)|) we have the estimation” 


| Pr-1(X»)| = eS [n= 46,8... y= 2,3,...,4. 
Proor. Denoting for OZ F=a 
(2. 4. 1) u(#) = sin'.9-P,_1(cos #) 
and ‘ 
(2. 4.2) @(9) = (2 sin 9)? + [n— li 
SONIN’s theorem” gives that 
(2. 4.3) f() =a(9PF+ BH u (9) 


IU 


7° If x, —=cos A, and |P,-1(x,)|—=M,, then owing 
to (2.4.2) and (2. 4.3) we —s 


increases for OZ = 


| cos 4, 
TOS) BR 2 sink, 


On the other hand, we apply SONIN’s theorem (2.4.3) with #— J, and 


f(H,) = sin $,-M, | mi< M;-2 sin 9,. 


IU ¢ Wal Te 
J = Area (< 4,< %,). This gives 
M?-2 sin 9, a ee =|> u i! ) 
sin | => 
(2. 4. 4) Kn 1) ane). 
IU It P 
10a eae P.i(cosz =) 


But, as well known,” 
n-1 


P,-1(cos #) = > a, cos vF 


v=0 


15 One could deduce Lemma 2. 1. and (2.3.2) also from the deep asymptotical rep- 
resentation of P,_1(x) due to Hits, without*explicit constants. We shall not need this rep- 
resentation in this paper. With slight modifications one could obtain also the correspond- 
ing lower bound also for odd n’s but we do not need it. For the relative extrema in 
—1< x< 0 obviously an analogous estimation holds. For » = 1 the lemma holds trivially. 
Our first proof was longer than that in the text and also the numerical constant was 
worse; the proof in the text was communicated to us in a letter of Prof.G. Szec6 in 
4 Nov. 1957. 

16 See e. g. Szea6, I. c., p. 160. 

i See, 2. 9ZEGO; lc. pslol. 
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n-1 
with a,>O and 2 d= 1; hence 


Ee 8 | 
P, [cos wa] > cos 7 > as =F" 
i. e. from (2. 4. 4) 
2 2 : 1 

(2. 4. 5) 24,M, > M,-2 sin d,> aay 
If g,’s stand for the zeros of P,-1(cos 4), we evidently have 

O=A<MKKAKN <<< GY <- <n 
and thus from (2. 4. 5) 
] 1 


. 4.6 M; > ; 
(2. 4. 6) > 8F,(n—1) ~ 8g,(n—1) 
But owing to the separation theorem of BRUNS"™ we have for our »’s 

| 7 DE 
(2. 4. 7) (p+) 2 <gcvZ, 
which together with (2.4.6) proves the lemma. 
For later purposes we remark that for 0< 9, = a we have 
; 3 hs 

(2. 4. 8)  o >lv— De peor i 


\ / 


§ 3. Investigation of the fundamental functions of the second kind 


1. In this § we shall estimate the quantity 


Lie! 


It follows immediately from (2.1.1), (2.1.2), (2.3.4) and (2.3.5) that for 
n=—4,6,8,... and —1=x=+1 
2 
VO) ee 
(n—I 
(3.1.1) leet) 


2 
| On (x)| = M1) 


For the further fundamental functions we have 


LEMMA 3.1. For n=4,6,8,.... and —1=x=+1 we have 
= [4(x)|— 23) y ~ 5 
|or(x)| = (34 arath 1287 a (n—lpP for 2sVvs 2 


18 See Szec6, |. c., p. 118, formula (6. 21. 7). 
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204 
ar WOO) yay ry 
— < = 2 
for ae y=n—l. 
Proor. Obviously, it suffices to prove the first assertion. Let first be 
XG Xess 1. 

Since 

a 1(t) Pe 1) Le i(t) 

[oe t—Xy he TPS co pot 


23 


we have owing to (2. 3.5) 


r Pa-1(t) 2 1 1 1 ] 
|? t—x, at| = Xy—X af 1+x, ‘= rare 1—x J 
= 
Then (2. 2. 1) gives eae to (2.1.4) and (2. 3.5) 
IT,(x)| 


6 


1.2) Ol pay 9S oreo toa 
4 I(x)| \5(2) 


3 (1-2) Patt) 1PZie)| UC) PAaG)| (2) aoe 


Since from (2. 3. 6) 
(1— 5) Pits (xp) = —n(n—1) Pa-1 (Xr) 
and from (1.1.1) 
IT.{x,) == —n(n—1)Py-1 (Xp), 
further 
le a 
|Pria(%»)| a(n—1)|Pa-1%)| ” 
Lemma 2.1 and (2.3.4) give from (3. 1. 2) 
— yar |b(O)|U—3) & teeth 1 
|e,(x)| = Me ar ps ca Vv+ 1282 (qty 


For —1=x,<.x the estimation runs similarly, since we have again 


J Fao a 
x—xX, 1—x,; 


For xx, the lemma obviously holds. 
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From Lemma 3.1 we can deduce 


LEMMA 3.2. We have for n=4,6,8,... and —1<x=+1 the esti- 
mation 


: 36 
2 le) = 
ProoF. From (3. 1.1) and Lemma 3.1, using also (2.3.10), we obtain 


2 


SleWl saggy + By 88 | Sy ucol4 > Va=r|t,09\| + 


=" 41 
se 


n 


Q 7 2 Te ( "Ys 
4 332 _ 347 fv \8z2 (27) Paizcy ts ae Fr 20 _ 360 


n n a(n— n n 


In order to show that ee 3.2 is best- aeerte what order concerns, 
we state 


LEMMA 3.3. We have for all even n=8 the inequality 
n C. 
>, |er(0)| >—. 
y=) n 


Proor. From (2.1.3) and (1.1.1) we have 


= ] : 0 
Py 0 2 — 1 
Sais 2 Tay ly P | me cy rie fj 20 at+ 


Pe 414) 
t—Xx, 


SED | 


Using (2. 3. 7) and (2.3.2) this gives 


(7 
2 Ol> sareaay , }i—x, 


= 2) | Ay. 
-1 


eel 
2 Pyi(t) ae 
(1—x,) [fee dt 
=i 


Taking into account’ (Lemma 6. 1) that 


Pp 
2, 
Pi. Pri) 4 — 2X 


t—x, = ii) Prs(Xy)” 
“4 
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we obtain, using once more (2. 3. 2), 


Pea | 2 
Sie > DATRaay re V8 (py os 


8 


-5-a| fal)» aig SVR) TRO 


: [3] 
0 ee | > aie ma {|2en (1—x3)—40} > 


ed nat 


§ 4. Investigation of the fundamental functions of the first kind 


1. We need the 
LEMMA 4.1. For n=4,6,8,... 


In@)<G+2Va, |x) <Gt2Vn 


and —1=x=-+1 the estimations 


hold. 
ProoF. It is enough to consider only r,(x). Owing to (2.1.5), (2. 3. 10) 
and (2.3.5) we have 


“ka +— | Tn (x)|- 


In(x)|S1 4-5 


Using (2.3.9) and (2.3.4) the lemma is proved. 
Further we have 


LEMMA 4. 2. For n=4,6,8,... and —l1=x=+1 we have 


-@)|=8ta|/ 2 for 2evs5, 


Ir,(x)|=872 — for 5 <vsn-i. 


PROOF. We may confine ourselves to the case 2= vss. Let first be 


x<x,. Then the representation (2.2.5) gives with (2. 3. 10), (2. 3. 4), (2. 3.5) 
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2 
2| ca 1 
n—l)\n (1—Xy)|Pa-1(%)) 
3 (n—lVn 1—x 
Since according to ROLLE’s theorem we have 


and Lemma 2. 1 


IA 


, dt 
Ty =|X—xX, ae 
aay les | | Gam 7 


. 


Xy< eo 
and thus, using again BRUNS’s estimation (2. 4. 7), 
f a 9 
y— >| wv 
2 gree nse 28 4 2 4 | 3 v 
] oe So E-1= sin Ps 8! 23 (n—l)iw | > 4(n—1)” 


Lemma 4.2 follows from (4.2.1) for x<x,. For x >x, this follows analog- 
ously, starting from (2.2.6) instead of (2.2.5). For x—x, the lemma is 
rivial. 

From Lemma 4.1 and 4.2 it follows evidently 

LEMMA 4.3. For n=4,6,8,... and —1S=x=+1 we have 


> |r(x)| S249 20. 
w= 


2. In order to show that the estimation of Lemma 4.3 is essentially 
sest-possible, we prove 


LEMMA 4.4. For all sufficiently large even n’s we have for a_ suitable 
1umerical positive c 
pa |r+(O)| > cn, 
[el="=E] 


.e. a fortiori 


 |rr(0)| > C5 N. 


Proor. Using the representation (2. 2.3) we have for 2=7= > 
0 
IT, (0) 1,(t) 1 
r,(O) = —— } | ———— dt— — : 
©) ITi(xy) | J (t—xy)° 2(1— x3) Pn-1(X»)" 
=f 


Ising (1.1.1), (2.3.7), (2.3.10) and (2.3.2) for sufficiently large even n’s 
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and for 2 | =v=|4| we obtain with numerical positive c, and c, 


1 hg, 
3V/n(n—1)|Pn-1(X»)| | 211— 25) Pas) X 
Ce 
> SS ee ee = 
Yn (n—1)|Pn-1(%»)/? 
from which Lemma 4. 4 easily follows. 


|r-(0)| > 


Cy 


§ 5. Lemmas on Jackson means 


1. Let g(#) have the period 27 and its Jackson means” 
4 


sinn 


3 r 2 
‘yon sin 5 


An alternative form of /,(.9, @) is, as well known, 
n/2 


G.1.2) Jul, 9)— —aovey| {p(F + 2t) + g(F—28)} ans) dt. 


sint 
From (5.152) it follows 


n/2 


6 sinnt\* 
Cohe) sae Var) 
: 0 
We need the following lemma which is certainly well known, but we know 
no place where it is explicitly stated; so we sketch its (conventional) proof. 
LEMMA 5.1. /f (+) is everywhere continuously derivable, then for an 
arbitrary small «>0O we have for n> n,(e) 
é 
\P(9)—Jn(9; )| S—. 


Proor. From (5.1.2) and (5.1.3) we get 
pase (F) =Jn(F, P)—P(F) = 


» 3 sinnt\* 
= amar en! (9(9 +21) + (9 —21)—29(9)}| ae dt. 


19 D. Jackson, Uber die Genauigkeit der Anndherung stetiger Funktionen durch Poly- 


nome gegebenen Grades und trigonometrische Summen gegebener Ordnung, Inaug. Diss. 
(Géttingen, 1911). 
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The mean value theorem gives 


a | 


m4 : \4 
a = 575 | 2¢(9'(t) 9} pa dt 


with 


(5.1.5) FSLS94+24, GYEth=9—2t 
Since owing to the hypothesis and (5.1.5) we have 
(5. 1. 6) | P(t) —¢'(t)| = @, (4t) 
denoting by «,(6) the continuity modul of g’(9), (5.1. 4) gives 
BE. 1 nas m 
2 an he a 
sinnt 1 
61 = aaparen| 4060( Fer) <a) +[+f{< 
0 1 
"Ya 
1 ae 
3 ; Vn ” 
< Aja | tor(2tyat+ (2) pes sat) at+(2 “| foe? atl cae 
n 2} ie n 
0 1 1 
n Vr 
or. 7? > n{2). Q. €, d. 
2. Let now f(x) be continuously derivable in [—1, + 1] and 
(5. 2. 1) p(F) =f(cos F). 
Let w(0) be the continuity modul of f’(x) for —l1=x=+1 with existing 
Jape. 


If max |f(x)|—M, then 
-lSr=+l 


age oars (=) 9 salle fas ee e 


max 


(ee yi—x| = \i=2)__, [So +ms, 


| 9”’- 9 |=6 x=cos 
i.e. the integral 
@,(v) 
. 2. 2) ole dv 
0 
exists too. 


We consider the polynomials /,(9,y) belonging to y(t)—f(cos 9). 
Since g(%) is now even, J,(9%,g) is a pure cosine polynomial of order 
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210 J. BALAZS AND P, TURAN 
n—z2), 1. €. 
¢ Jn (are COS X, P) = 712n-2(X) 
s a rational polynomial of degree (2n—2) and 


wo] 3 


3 
Tay-2(X) = anon | {g(arc cosx+ 2t)+ 


: 4 
sin at a 


(5.2.9) 
+ p(arc cosx—2?)} ( me 


Lemma 5.1 gives for —1=x=-+ 1, arbitrary small ¢>0 and n>n,(e) 


|t2n-2(%)—f(x)| = — 


(5. 2. 4) 
Differentiating (5. 2. 3) one-times according to x we get 
3 | a) 
T2n-9(X) = <F 
ae ~ stn(2n?-+-1) 7 ( u = are cos xr+2t 
dy ©) & at) 
—— ——| dt 
+ du Ju=arecosx-2t) \ sint 
or using the alternative form (5.1.1) 
= r sin n fate cosx\* 
i oe 3 ] fae 2 
ie 27en(2n’ +1) Y1— x dt . t—arc cosx 
hn Si ose 
Differentiating once more on the last form we get. 
' Weer: 
. sin n ——— 
Tha) or eee ee a oe Are eal Bt peo 
27n(2n’ +1) (l—x)” dt Br es 
sin 
tx 
ee ee wie dg(t)| 1°" a sina! 
mn(2n?+1)1—x J) dt— 
Ale; sin! 
t t— = 
n sin — — cos n 7 — Sinn D yecoge 
at. 
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Returning to the form (5.1.2) this gives 


to| Q 


fr{2)) +(e ult 6 + (geen 
+( du Jy—s-x}\ sint OT ana FD) i = $42 
(5. 2.5) | x 
a 2) = n Vn cosnt 5, 6 al ae) 
du },—o-\\sint) > sint 7n(2n® + 1) i= v=o 


lava 


With the aid of this representation of z1/,-2(x) we can easily prove 


innt 
ee J ctg tdt= u,(x) + Ug(x) + s(x). 


LEMMA 5.2. For —1<x<+1 we have for n>n,(e) for the z2n-2(x) 


defined in (5.2.3) the estimation 


1 ae t) are 
(xy "e ae 


TUS, -2(X = 
|r,-2(3)| ao 


Proor. Denoting 
df(cos F) 
ig 7 Nahe Caml 


max 
> 


we have from (5.2.5) and (5.1. 3) 


sinn 
see: Bite oe ah anon TD, net ‘sy ae yi 


For the estimation of u(x) and u;(x) we write 


nO) = art) #1, 


(5. 2. 7) Yn 
dg(u) cosnt ae n 4) cleansed Fae 
— (2 le sin’ int dt m(2n®?+ 1) — te at 3] 


14* 
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and | 
heer 8B Bip ele an a (u) 
6 I dg (u = 
~~ ane +1) eal J+f+] eres 
(5. 2. 8) t 4 
dg(u) sin nt > ae = 6 vb}, 
—( du joe (a cares an(2n?+1) 1-2 ola +h, 


respectively. For /, we have owing to (5.1.6), (1.2.3) and (5.2.2) for 


n> n;(8) : 


6 w,(2t) 
|L|= m(2n?+ 1) tafe wdt<7—s 


is 


The same holds for /,. For /, we have for n> 1,(8) 


"s 
mnt) én 
FA ata] dt< tr 


The same holds for ,. For /; we have for n> 1n,(e) 


cy M, dt a én 
mix) ) eto 
1 


Vn 


The same holds for /,. This proves Lemma 5. 2. 
Lemma 5.2 gives no information for x +1. This is given by 


LEMMA 5.3. We have for the zt2n-2(x) defined in (5.2.3) the estimation 
| 0in-2( + 1)| = Con. 


PRoor. If 2'=2n—2 < 2*+!, we write 


|4s|= 


(5. 2.9) z2n-2(X) = (702n-2(X) — 04x(X)) + 2 (a5) + m,(x). 
For —1=x=-+1 and from (5.2.4) we get roughly 
| 05541 (X) — 70g; (X)| S | 1g 541(x) —f(x)| + |0,;(2) —F(x)| S I 
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nd similarly for |7t2,-2(x)—2,.(x)|. Thus MARKOV’s inequality gives 
| 203i:44(X)— 7045 (X)| S C2” 


ind similarly for |72n-2(x)—-1}.(x)|. Thus we get 


k-1 
| 723n-2(X)| Se3n*® + D2 Ca: 2 SGN, 
J= 


§ 6. The proof of Theorem | 


1. The previous lemmas lead quickly to the proof of Theorem |. For 
the polynomial z,-2(x) in (5. 2.3) we have owing to (2. 2.7) 


(6. 1. 1) T02n-2(X) 2 pia Tonal Xen ign (x) + 2 TU3n- 2 (Xyn) Ovn(X). 


Hence owing to this, (1.2.2) and (1.2.4) we have for n>1n,(e) 


UAC2) — Rel, f)| =|) —-t20-2(2)| +| (etn 20) Pen) Fon) + 


= |f(%)— 7on-2(%)| + 


- > (705, -2 (Xn) re Bn) Orn (x) 
(6. 1. 2) _ 


x 23 | Ton (x)| wee |f(u) —Z2n-2(u)| + en > | Onn (X)| + 


+ p> | 705,-2(Xyn)| |On(X)}- 


Using Lemma 5.1 and Lemma 4.3 the first two terms tend to O uniformly 
for —1=x=+1; so does the third term owing to Lemma 3. 2. To estimate 
the last sum in (6. 1. 2) 


D |in-2(Xrn)| |mm(x)| = S 
we write owing to (1. 2. 1) 
n-1 
(6.1.3) S= |z03,-2(1)| |Qrn(X)| + | 205n-2(—1)| Onn ()| + Dd |7tin-2(%on)| |@on(X)| 


Lemma 5.3 and (3.1.1) obviously give for the first two terms in (6.1.3) 
1 


the upper bound c,n ®. In order to estimate the critical sum 


n-1 


5; = a | 7131-2 (Xam) | |Ovn (x)| 


v=2 
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we use Lemma 5.2 and Lemma 3.1. These give 


Sq seen ea panlky +2 ae 


v=2 (i— —x2,)" + eae 
dbx) Vr 
(6.1.4) =Cn > ie ya ten + 
Le vy’! 2 M. én , me tet 
+¢ Co 2 at a EIN, CRESS SS yt ty 


The “heaviest” terms are the sums 


en Sen 8 SV lm) 


and 


Wh 94 Js 
For S;’ ScHwarz’s inequality gives owing to (2. 3.10) 


n 1, n “lg 
(6. 1. 5) Ss = Pca (> »| < Cig# 
and for S;” oving to (2. 4. 8) 
2 
(6. 1.6) wi ap SUE ema 
N® egsvEn-1V/y 


For the remaining two sums 
Size M, ° s Vv [Ln (x)| gv Mn S aan 


9 ’ tame 


nt FB (1— xp)" ms 3 (1—x;,)" 
we have owing to (2. 4. 8) 


(6. 1. 7) Sic oot S Lbon(x)| vn(X)| _- CaM, en 
=) Vy 
and 
MS -2 — coM 
(6. 1. 8) St < &x 1 y Pe cae 
Shan te Vin 


(6.1.2), (6.1.4), (6. 1.5), (6.1.6), (6.1.7) and: (6. 1.8) complete the proof 
of Theorem I. 
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ON MIXING SEQUENCES OF SETS 


By 
A. RENYI (Budapest), member of the Academy 


Introduction 


Let [§2, A, u] be a measure space. By other words, let 2 be an arbitrary 
abstract set, ( a o-algebra of subsets of 2 and u(A) (A€@) a measure 
defined in $2 and on G&. We shall denote tne elements of 4 by capital 
letters A, B,C,.... The elements of 2 will be denoted by w. We denote by 
A+B the union and by AB the intersection of the sets A and B. 

We shall call a sequence A, (n=O, 1,...) of measurable sets strongly 
mixing with density « if for any BEA, such that u(B) <-+ o, we have 
(1) lim «“(A, B)=e«u(B) 
where O<a@<.1 and the value of @ does not depend on B. 

Evidently, in the case when u(2)<-+ 0, we have, choosing in (1) 
B= 92, 

(2) lim “«(A,)= @ # (£2). 


Thus if «(8)<-+ <<, (1) can also be written in the form 


@ Dey Ser 


The term “strongly mixing” has been chosen in accordance with the well- 
known definition of a strongly mixing measure preserving transformation of 
a measure space in ergodic theory (see [1], [2]). As a matter of fact, if 7 is 
a measurable transformation of the measure space [§2,4,u] preserving the 
measure « and “(Q)<-+ cx, then 7 is called strongly mixing if for any 


‘A€d and BEA we have - 
. =n u (A) u 
(4) lim «(7 A-B)= apts) 


Taking into account that in this case «(7 -"A) =" (A) (n=0,1,.--) and 
using the terminology introduced above, we may say that the measure preserv- 


ing transformation 7 is strongly mixing if and only if for any A€ ray 
? fh con be 
sequence A,— 7 "A (n=O,1,...) is strongly mixing with density Oe 
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This is, however, a very special way of obtaining strongly mixing sequences 
of sets, as will be seen from the examples given below. 

The notion of strongly mixing sequences of sets is especially important 
in probability theory. In the present paper we shall mostly deal with these 
applications, and therefore we suppose in general that the measure space 
considered is a probability space, i. e. ~(§2)—1. To avoid misunderstandings 
we shall denote probability measures by P (or Q). If [§2,, P] is a proba- 
bility space, then, as usual, the elements of & will be called events. Thus a 
sequence A, (n=O,1,...) of events will be called strongly mixing with 
density @ if for any event BE A we have 
(5) lim P(A, B)=e«P(B) 
where 0<a<:l. As (5) is trivially satisfied (with every value of @) for any 
sequence A, of events if the event B has probability 0, it suffices to suppose 
that (5) holds if P(B)>0. By using the usual notation P(A|8) for the 
conditional probability of the event A with respect to the event B, defined 
in the.case P(B) >0 by 


__P(AB) 
we may write (5) in the following equivalent form: 
(5°) lim P(A,|B)=e« 


n> © 


for every event B for which P(8)>0. Thus a sequence A, (n=O,1,...) 
of events is strongly mixing with density @ (0<a@<1) if (5°) is satisfied 
for every B which has a positive probability. 

It is easy to show that the following theorem’ holds: 


THEOREM 1. Jf [82,4,P] is a probability space and the sequence 
A, (n=0,1,...) of events is strongly mixing with density @, then 
(7) lim Q(A,) =a 
holds for any probability measure Q in 2 and on Q which is absolutely 
continuous with respect to the measure P. 


Proor. By the Radon—Nikodym theorem there exists a non-negative 
and measurable function y(@) on $2 which is integrable with respect to the 


i! This theorem is, of course, known. (It has been used e. g. implicitly i [3].) We 
state it here for the sake of reference, as we did not find it explicitly formulated in the 
literature. For the same reason we sketch its simple proof. 
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measure P and is such that for any A € 4 we have 


(8) Q(A) =| x(@)aP. 

Clearly, (7) holds if y(w) is a step function (i.e. if x (w) takes on 
only a finite number of different values). As to any integrable y and any 
é>0O there can be found a step function y, such that f| 4(@)—x:(w)|dP<e, 
it follows easily that (7) holds in the general case too. 

Thus Theorem 1 is proved. 

In § 1 of the present paper we shall give the following necessary and 
sufficient condition for a sequence of events being strongly mixing: 


THEOREM 2. The sequence A, of events, such that Aj and P(A,)>0 
(n= 1, 2,...), is strongly mixing with density @ if (and only if) 
(9) lim P(A, |A;,)=e 


for k=0,1,... where 0<@<1 and @ does not depend on k. 


Thus the strongly mixing property of the sequence A, depends on the 
relative positions of the sets A, only. 

Theorem 2 will be proved in § 1 by means of Lemma 1, relating to 
sequences of elements of an arbitrary Hilbert space. 

Theorem 2 is fairly general and when applied to different types of 
sequences of events, leads to some interesting special cases. One of these 
is the following: 


THEOREM 4. Let &,, &,...,5:,... be a sequence of independent random 
variables on the probability space [&2,4,P] and let us suppose that there can 
be found a sequence C,, of real numbers and another sequence D, of positive 
numbers such that lim D,=-+ 0%, further a distribution function F(x) such 


n+>@O 


that putting C.==§&+&+-:-+6 (n=1,2,...) we have 


- Cn —C, ; 
(10) lim P| D, e x| == F(x) 
for every real x which is a point of continuity of the distribution function 


F(x). Let Q be an arbitrary probability measure in §2 and on & which is 


2 The supposition P(A,) >0 for every n= 1 is made only to make a simple for- 
mulation of our result possible; it is not an essential restriction. As a matter of fact, 
according to the definition, in a strongly mixing sequence of events there can occur only 
a finite number of events having the probability 0, and these may be omitted as the 
strongly mixing character of a sequence of events is not influenced by the change of a finite 
number of elements of the sequence. The condition Aj is not a restriction either ; it 
has been supposed only to include the condition lim P (An) = « into (9). 


n-> © 


218 A. RENYI 


absolutely continuous with respect to P. Then we have 


f ima eGo <3)—re 


in every point of continuity x of F(x). 


Thus the fact that the distribution of 


Cnr —Cr 
D, 
ution as well as this limiting distribution itself, are invariant against the 
change of the underlying probability measure, provided that this measure P 
is replaced by a probability measure Q which is absolutely continuous with 

respect to P. } 

Note that with respect to the measure Q the random variables §&, are, 
in general, not independent. Thus Theorem 3 may be considered as a result 
extending the validity of the limit theorems of probability theory, valid for 
independent random variables, to certain sequences of “almost independent” 
random variables. 

The first result of the type of Theorem 4 has been given by the author 
of the present paper in [3] where there were two restrictions: it has been 
supposed that the random variables §, have discrete distributions and that 
the probability space [§2,4,P] is isomorphic to the probability space for 
which §2 is the interval (0,1) and P the ordinary Lebesgue measure. In a 
subsequent paper [4] A. N. KOLMOGOROV has proved a more general result. 
He dropped the supposition that the variables &, are discrete, and concern- 
ing the probability space he supposed that the measure P is perfect (for 
the definition of perfect measures see [5]). Theorem 4 does not contain any 
restriction concerning the probability space, thus it is more general than the 
result of KOLMOGOROV mentioned above. It has been pointed out by 
E. MARCZEWSKI (oral communication) that Theorem 4 can be deduced also 
from certain results of E. SPARRE-ANDERSEN and B. JESSEN [6]. P. REvVESz 
(oral communication) has shown that Theorem 3 can be proved also by 
using certain limit theorems of J. L. DooB on martingales [7]. However, 
the proof given in § 2 of the present paper, which shows that Theorem 4 
is a special case of Theorem 2, isin some sense the most natural approach. | 
As a matter of fact, Theorem 2 is a source of a large number of similar 
results which can not all be obtained by the other methods mentioned. We 
can obtain e. g. by means of Theorem 2 results similar to Theorem 4 for 
general Markov chains instead of the special Markov chains formed by par- 
tial sums of independent random variables.’ 


tends to a limiting distrib- 


’ This question will be discussed in a forthcoming joint paper of P. Révész and the 
author. 
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Theorem 2 when applied to ergodic theory leads to a criterion (Theo- 
rem 3) for a measure preserving transformation defined on the measure space 
[$2, A, u] being strongly mixing. 

In § 3 we consider weakly mixing sequences of sets and events, re- 
spectively, and obtain similar results as in the case of strong mixing. 

My thanks are due to Mr. P. Révész for his valuable remarks which I 
utilized in preparing the present paper. 


§ 1. A criterion for the strongly mixing property of a sequence 
of events 


Let 3€ be an arbitrary Hilbert space. We denote the elements of 3 by 
small letters (e. g. f,g). The inner product of the elements f and g will be 
denoted by (f,g) and the norm (f,f)'? of f by ||f||. We first prove the fol- 
lowing 

LEMMA I. Let f, (n==0,1,...) be a sequence of elements of a Hilbert 
space X. Let us suppose that 


(1.1) lll =K  (n=0,1,...) 


where K isa positive constant not depending on n. Let us suppose further that 
for any k=0,1,... we have 


1. 2) lim (fx, fn) = 0. 
Then for any g€H# we have 
1. 3) lim (g, f,) =0. 


Proor. Let us denote by 3, the least subspace of 3 which contains 
the elements fo, f,,.--,fn,---- Clearly, (1.3) holds if g is a finite linear 


combination of the elements f.,fi,--..fu,---) ie. if g= Derhe It follows 
that (1.3) holds also if g is an arbitrary element of 3,, because in this case 
for any ¢>0 there exists a finite linear combination g, = 2 trh such that 


||g—zg,||< which implies that . 


(1. 4) \(g, fn) — (B15 Sn)| = Ke 
and thus 
(1.5) lim sup (2, fn)| S Ke. 


As «>O is arbitrary, (1.5) implies (1.3). Now, let 3, denote the set of 
those elements of 3( which are orthogonal to every element of the sequence 
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fr. Clearly, (1.3) holds if g € 9€,. As by a well-known theorem (see [8], p. 8) 
every g€% can be represented in the form gg, 1&2 where g, € 3, and 
2,€%, it follows‘ that (1.3) holds for any gé%. Thus our lemma is 
proved.” 

It should be mentioned that our lemma contains as a special case the 
well-known fact that if {f,} is an orthonormal system, the Fourier coefficients 
(g, fo) of an arbitrary g€% are tending to 0 for n— ov. This fact is usually 
proved by means of BESSEL’s inequality which gives, of course, much more. 
The corresponding stronger result under the supposition (1.2) will be given 
in a forthcoming paper. 

We now deduce from our lemma 


THEOREM 2. Let[2,4,P] be a probability space. Let A, (n=O, 1,...) be 
a sequence of events such that Aj=8 and P(A,)>0O (n=1,2,...). The 
sequence A,, of events is strongly mixing with density a (Q<a@<1) if (and 
only if) 
(1.6) lim P(A,|A;) = @ 
for. kK=0,1,:<..2% 

PROOF OF THEOREM 2. Let 3{ denote the Hilbert space of all real ran- 
dom variables §==§&(w) (w € £2) such that |eaP exists. Let us define the 

: Q 
inner product by (&, 7) = | E7dP and, correspondingly, the norm by 
1/2 Q 

lsi—=(JPaP) 


Let the random variables @,—«@,(w) be defined as follows. 


-|'7" if w€Ay, 

a, (w) = Pe (n= OAlisa). 
Then we have 

(loot) (a, @n) = P (A; An) —@ P(A,)—a@ P(A,) + 2. 

As A, = $82, it follows from (1.6) that 

Further it follows from (1.6) that 

(1.9) lim P(A, Ax) = a@ P(A,) (Rael 23500), 


n-> © 


* B. Sz.-Nacy kindly called my attention to the fact that the idea of the above 
proof of our lemma is the same as that of the standard proof of the theorem (see e. g. [8], 
p. 10) that if f, is an arbitrary sequence of elements of 9% such that \|f,|| is bounded, 
pe ah exists a subsequence of the sequence f, which converges weakly to an element 

of %. 


5 Another proof of Lemma 1 has been found independently by P. Révész. 


ON MIXING SEQUENCES OF SETS 221 


3 From (1.7), (1.8) and (1.9) we obtain 
(1. 10) lim (@x, @n) =O (K=0,1,.....). 


n-» 


Taking into account that 

Bi si.1) ||@¢n||? = (1 —@) P(A,) +e? (1—P(A,)) = 1, 

we see that the sequence @, satisfies the conditions of Lemma 1. Thus we 
have for any gE X 


(1. 12) lim. (2, c,) = 0. ° 
Choosing for g —g(m) the random variable defined by 
irl wit ie, 
pe t3) 8M =j if w€B, 
we have 
(i. 14) (g, G3) P(A, B)—a« P(B) 
and thus by virtue of (1.12) we obtain, provided that P(B) > 0, 
(1. 15) lim P(A,| B) =e, 


Thus Theorem 2 is proved. 

By combining Theorem 2 with Theorem 1 it follows’ that if Q is any 
probability measure in §2 and on G@ which is absolutely continuous with 
respect to P, and A, satisfies the conditions of Theorem 2, then we have 


(1. 16) lim Q(A,) =e. 


Let us now consider the application of Theorem 2 to ergodic theory. 
Let [2, , «] be a measure space and suppose that u(§2)<-+ oo. A measure 
preserving (not necessarily one-to-one) transformation 7 of this space is 
called strongly mixing if, denoting by TA the inverse image of the set A 
(i. e. the set of those wm € 2 for which Tm € A) and defining T "A by the 
recursion T" A—=7T™ (T 'A) (n=2, 3,...), we have for any A € Gand BEG 


. E u (A) #(B) 
lod - lim u(T"A-B) =———.. 
(1. 17) Jim u¢ aa 2a) 
6 It should be mentioned that (1.16) could be deduced directly from the above proof 
of Theorem 2 without making use of Theorem 1. As a matter of fact, let y—y(w) be a 
function, the existence of which is ensured by the Radon—Nikodym theorem, such that 


Q(A) = | y(w)dP for AEG. 
A 
If X belongs to jf, i. e. if aah Beets then applying (1.12) to this function X we directly 


obtain (1. 16). The cereal case follows by remarking that to any integrable random 


variable y and any « >0 there can be found a x, € $f such that {ix —y7,\dP<e. 
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Applying Theorem 2 to the sequence A, = T "A of sets of the probability 


space [, 4, P] where P(A) = mo} 


of the supposed measure preserving property of the transformation T 
(1.18) w(T*A:T*A) =e (T* (TO A-A)) =H (T “PA-A) 
for n=k, we obtain the following 

THEOREM 3. Let [2,4,u] be a measure space, u($2)<+c and Ta 
measure preserving transformation of 92 onto itself. A necessary and sufficient 
condition for T being strongly mixing (i.e. for the validity of (1. 17)) is that 
for ca? A€@ with u(A)>0 we should have 


-". 


By other words, if (1.17) is valid for Sioa it is always valid. 


and taking into account that by virtue 


§ 2. The invariance of the limiting distribution of sums 
of independent random variables 


In this § we prove 


THEOREM 4. Let &,&,...,&:,... be a sequence of independent random 
variables defined on the probability space [§2,Q,P]. Let us suppose that there 
can be found a sequence C, of real numbers and another sequence D,, of 
positive numbers for which lim D,=-+ 0c, further a distribution function 


F(x) such that putting ee AS er --» +, we have 
(2.1) lim pS So <x|=F@ 


in every point of continuity x of the distribution function F(x). Let Q be an 
arbitrary measure in §2 and on & which is absolutely continuous with respect 
to P. Then we have 
(2. 2) lim oY fe n< x)= == F(x) 
if x is any point of continuity of F (x), 

PROOF OF THEOREM 4. Let x be a point of continuity of F(x) and 
F(x) >0. ey it suffices to consider such values of x. In this case evi- 


dently P (eae 


<3] >0 for n>ny. Let us put A, = £2 and denote by A, 


the event that the inequality cia <x takes place (n=1,2,...) 


n+Nno 
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According to Theorems 1 and 2, if we show that condition (1. 6) is fulfilled 


for these events, (2.2) follows. Let us put ce Sa Cn Thus it suffices to 
prove that ; 
2: 3) lim P(O,<x|oi<x)=F(x) 


for any k>n. 
Now we need the following simple lemma (see e. g. [9], p. 254): 


LEMMA 2. /f #, and £, are random variables such that lim P (9.< x) = 


= F(x) in every point of continuity x of the distribution function F (x), and 
jim P(|én| = 0)=0 for any 0>0, then we have lim P(9,+ &, < x)= F(x) 


n+>@® 


in Einy point of continuity of F(x). 


Applying. Lemma 2 to %,—=C, and «,—=— p it followsfrom (2.1) that 
(2. 4) lim pla < x]= F(x). 
As t* — “i Se is independent of &%, we have 
(2. 5) ne: 2 g<x|—P(G— <;| 
and thus from (2. 4) 
(2. 6) dim ee xPGe< xX J=FO). 
Applying again Lemma 2 to the random variables =F and 


[= a on the probability space [82,4,P’] where P’(A)=P(A|& <x), 
we obtain (2.3). Thus Theorem 3 is proved. 

Let us call a sequence 7, (n=1,2,...) of random variables a mixing 
sequence with the limiting distribution function F(x) if for every BEA with 
P(B)>0 and for every real x which isa point of continuity of F(x) we have 


(2. 7) lim P(1n < x|B) = F(x). 


The assertion of Theorem 3 can be expressed by saying that if the random 
variables —, are independent and putting ¢,—&++---+& the random 


variables oe where D,, — , have the limiting distribution function 


? 


F(x); then f% is a mixing sequence of random variables with the limiting 
distribution function F(x). 
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Mixing sequences of random variables have remarkable properties. For 
instance, if 7, is a mixing sequence of random variables, then 7, is in the 
limit independent of any random variable #. As a matter of fact, if 


P(#<y)>O0, we have } 
(2.8) lim P (qn <x, F< y)=P(F< y) lim P (qn < x|-F < y)—=P(F < y) F(x). 


Thus we obtain the following consequence of Theorem 4: 
Coro.iary 1. Jf the random variables & are independent, o,—=§+ 
+8&+.--+8,, and there can be found sequences of real numbers C, and 


; 


D, >0O such that D,—-+ © and Saat! has the limiting distribution 


F(x), then ¢; is in the limit independent of any random variable. 


Another interesting property of mixing sequences of random variables 
with a non-degenerate limiting distribution is that they can not be stochas- 
tically convergent to some random variable. As a matter of fact, let us 
suppose in contrary to our statement that 7, is a mixing sequence of random 
variables with the non-degenerate limiting distribution F(x), and that 2, 
tends stochastically to the random variable 7., i.e. for any d >O we have 


lim P (| j.—No| = d)=0. 
Then evidently by Lemma 2 
(2. 9) P(t» <x)==lim P (tm, < x)= F(x), 
further by Theorem 4 and Lemma 2 
(210) Pie = % Te 7) = lim P (tin < X, Me < Y) = F(x) P(m < y), 


and therefore, applying again Theorem 3 and Lemma 2, 

(2. 11) P (70 < Xp Tie = y)= lim P (Na < xX, nm < y) = F(x) F(y). 

Thus no would be independent of itself which is clearly impossible, as by 
(2.9) and the supposition that F(x) is a non-degenerate distribution, no is 


not a constant. 
Thus we obtain the following 


COROLLARY 2. Jf &,&,...,&,... are independent random variables, 
further there can be found real sequences C, and D,>0O with D,—+-+- 0% 


such that putting ¢,.—6&+---+&, and re Sa — Cn te limiting distribution 
of &% exists and is non-degenerate, then the random variables Cx can not con- 
verge stochastically to a random variable. 


n 
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A special case of Corollary 2 has been mentioned in the textbook on 
probability theory of the author ({10], p. 534, Exercise 21). 

Let us consider an example. Let ; 
(2. 12) fee) 


eer ee 


be the dyadic expansion of the real number t (0<t< 1) where each «, (ft) 
is equal to O or 1. The functions ¢, (x) may be considered as random 
variables on the probability space [922,4,P], where 2 is the interval (Ot); 
€l the set of all Lebesgue measurable subsets of §2 and P the ordinary 
Lebesgue measure. The random variables ¢,(t) are clearly independent and each 


takes on the values 0 and 1 with probability > It follows by the Moivre— 
Laplace theorem that putting 


(2. 13) Sy (f) = & (t) + +++ +8, (A) 
we have 


@ 


(2. 14) lim P e 2du. 


fal 
eee 3.¢ = 
n--@ 1 — 27 
PAK, os 
Our Theorem 4 gives in this case the following result: If Q is any proba- 
bility measure defined on the Lebesgue measurable subsets of the interval 
(0, 1), which is absolutely continuous with respect to the Lebesgue measure, 
bn Cif 
(2. 15) Q(A)=|q (fat 

A 


1 
where g(¢)2O and Ja dt=1, then we have 


0 


n x 
Se UD igs 1 i < 
(2. 16) lim Q i ee SpE e 2 du. 
gla “a 
Let us define the set E,(x) as the set of those ?'s (0<¢< 1) for which 
n 
“Van 2x (n= 1, 2, ob)e Then,iclearly,74,(x)-1s a strongly mixing 
a: 


This example gives some idea about the structure of 


ts. ‘ 
ES ale can easily be constructed. 


strongly mixing sequences of sets, as tht: sets £,,(x) 


15 Acta Mathematica IX/1—2 
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§ 3. Weak mixing 


A measure preserving transformation T of the measure space [82, , x] 
with u(Q)<-++ oo is called weakly mixing (see [1], [2]) if for any AEQ 
and Bé & we have 


alin -" u(A)H(B) | __ 
(3. 1) lim 7 2, “u(T Asan ray =0, 


i.e. if u(T "A-B) is strongly (C, 1)-summable to the limit sO. Gener- 


alizing this notion, we shall say that the sequence A, (n=O,1,...) of sets 
is weakly mixing with density a (0<a<1) if for every BEG we have 


N-1 
(3. 2) tim 7S | (A.B) — a 1(B)|=0. 


A sequence of sets in a probability space which is weakly mixing with 
density a, will correspondingly be called a weakly mixing sequence of events 
(with density @). By the same method as used in the preceding §§ we can 
obtain analogous results for weak mixing. 

The analogue of Theorem 1 runs as follows: 


THEOREM 5. Jf the sequence A, (n=0,1,...) of events of the prob- 
ability space [§2,4,P] is weakly mixing with density e (0<a@< 1), we have 
for any probability measure Q in 2 and on G, which is absolutely con- 
tinuous with respect to P, 


N-1 
(3. 3) lim 5, |Q (Ax) — «|= 
N+>o N = 
The proof of Theorem 5 runs along the same lines as that of Theorem 1. 
Instead of Lemma 1 we need the following analogous 


LEMMA 3. Let f, (n=0,1,...) be a sequence of elements of the Hilbert 
space H. Let us suppose that 


1] N-1 
(3. 4) Wa, fll sx (N= 1,2, ...) 
further that for any k=0,1,... we have 


N-1 


(3.5) im 57 3 fafa) =0. 
Then we have for any geExX 


N-1 


(3.6) lim 5 & |g, fs)| =0. 
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PROOF OF LEMMA 3. Clearly, (3.6) holds if g is a finite linear combina- 
tion of the elements of the sequence f,, because 


1 N-1) / 7 r N-1 
w=, [Soh f = Deel a (fe Sd 


J n=0 
If 3, is the least subspace of # containing the sequence f, and gé€%,, we 


may find for any ¢ > 0 coefficients co, ci, ..., ¢- such that putting g,; = > tr fe 
we have ||g— gi||<.e. It follows that ig 


|I(g, f-)| — (gi, Su)| | = (Bs fa) — (Bt, Fe)| = Il fall 


and thus 
] N-1 1 N-1 
We \(g, fa)| — W =, (gi fr) = Ke 


what proves that (3.6) holds for any g€X,. But if we denote again by 2, 
the set of those elements % which are orthogonal to every f,, (3.6) evidently 
holds for g€%, too, and as every g€%X can be represented in the form 
g=—2£:tg with g,€%, and g.€%,, it follows that (3.6) holds for every 
g € X. Thus Lemma 3 is proved. From Lemma 3 we may deduce the following 
result which is analogous to Theorem 2: 

THEOREM 6. The sequence A, (n=O,1,...) of events belonging to the 
probability space [{2,4,P], for which A= and P(A) S00(n 1, 2, <2); 
is weakly mixing with density « (0<a@< 1) if (and only if) we have 

N-1 
(3. 7) lim Hr &, |P(An|Ax) — @| =0 for k=O,1,.... 
: N>o n—0 

The analogue of Theorem 3 for weakly mixing transformations may be 
stated as follows: 

THEOREM 7. The measure preserving transformation T of the measure 
space [2, 4, uJ, for which w(82)< +, Is weakly mixing if for any AEA 
for which u(A)>0 we have 


batiaies WE os w?(A) 
mae A:A) —eee 1 0. 
(3. 8) lim 35 ,|e(T" 4-4) — 779) 


The analogue of Theorem 4 for weakly mixing sequences of events is 
evidently also valid. 


(Received 6 February 1958) 
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ON THE THEORY OF DIOPHANTINE APPROXIMATIONS. II 
(INHOMOGENEOUS PROBLEMS) 


By 
VERA T. SOS (Budapest) 
(Presented by A. Rény1) 


§ 1 


The one-dimensional homogeneous problems of diophantine approximations 
have a unified treatment by the algorithm of continued fractions. It is possible 
to give such a geometrical interpretation of convergents and by-denominators 
(Nebennenner) of continued fractions, which can be extended for the inhomo- 
‘geneous case, and so it furnishes a parallel treatment of these cases. In 
this way, e.g., it is possible to prove some simple theorems of Borel type 
for the inhomogeneous case, to get new lower and upper bounds for the 
Khintchine constant c defined by 

c=inf sup inf xjax—f—y|. 
a B  «>0, yintegers 

This last result will be treated in [5] and [6]. © 

A similar algorithm, as we give in this paper for the inhomogeneous 
case, is given in an arithmetical way by J. W. S. CasseEts [1] and used also 
by R. DEscoMBEs [2]. A comparison of both treatments is made in footnote °*. 

In §2 we give this geometrical ‘interpretation of continued fractions for 
an irrational @ and the corresponding algorithm for the inhomogeneous case 
giving a sequence of multipla s,(?) which corresponds to the sequence of 
convergents and by-denominators of continued fractions, and further a sequence 
of pairs of multipla g;(@), gi(8) which is a subsequence of s,(@) and corres- 
ponds to the sequence of convergents gq, of @. 

In §3 we give the proof of some simple theorems of Borel type 
corresponding to the inhomogeneous case. We call these theorems Borel type, 
since BOREL sharpened Hurwitz’s theorem to the effect that the inequality 


I 
1.1) x|xa—y|< is 
is soluble with x being among any three consecutive convergents of a. It is 
well known that if we consider two consecutive convergents of «@, we. may 
assert only the solubility of the inequality 


1 
(1. 2) x|xa—yl< a 


230 VERA T. SOS 


among them, and the constant + cannot be diminished. For any convergent 


one may assert only the inequality 
(1. 3) x|xa—y|< 1, 


and again the constant 1 is best-possible. HURwITz’s theorem gives at once 
that for more than three consecutive convergents generally no inequality better 
than (1.1) can be proved. 

Corresponding to (1.3) and what has been said above we shall prove 
for the inhomogeneous case that to an irrational @ and real @ the inequality 


x|xa—p—y|< 


is soluble among any pairs q;((), gi(8) corresponding to e, and the constant 


rs is best-possible. Corresponding to (1.2) we shall prove that the inequality 


x|xe—8—y| <> 


has a solution among any fwo consecutive pairs gx(@), gi(8), Qe+1(8), Gisr(8) 
corresponding to @ and again a is best-possible. 

Concerning (1.1) we remark first that a theorem corresponding to 
HuRwiTz’s is due to Cassets [1] and asserts that for any real irrational @ 
and ?=- <na@>' the inequality 
ae 
28 77 +8 
has infinitely many solutions (with arbitrary «>0) and the constant a 
is best-possible. So one would expect that for any real irrational @ and 
8=—<ne> the inequality is soluble among any three consecutive pairs q,(@), 
Gi(P), Gx+1(8), i+1(), Qx+2(8), Qis2(8) corresponding to @. It is somewhat 
surprising, after what has been said above, that this is not the case. More- 
over, one can show that the number ¢hree cannot be replaced by any universal 


constant /. For any prescribed positive integer / we shall even show that 
the inequality 


x|xa—S—y|< 


x|xa—B8—yl\<c 
with any e< a is not soluble in general among any / consecutive pairs 


Jx+1(8), Giri (8), «+5 Qesi(8), Qisr(@) of our algorithm. 


1 <x> denotes the fractional part of the real number x. 
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§2 


In what follows let @ be irrational, O<a<1 and O=@<1. Starting 
in positive direction from a periphery-point O of the circle K with unity 


periphery, we put up the arcs with length # and ne for n=1,2,.... We 
Call the endpoints of these as the ‘““8-” and “na-points’, respectively. As it is 
easy to see, the structure of the na-points for n—1,2,... has the following 


PROPERTY A. The directed distance between the ma- and na-points 
for m>n is the same as that between the (m—n)a-point and the point O. 


DEFINITION. We call the s@-point and the corresponding multipla s 
adjacent to @ (corresponding to @) if there are no na-points with O<n<s 
in at least one of the two arcs determined by ¢ and the se-point. 

We shall use the following notations: 

The sequence of the adjacent multipla s to @ is denoted by 


51(8) = 52(8) < 53(8) << +++ <8, (8) <... 
where s,(@) = s.(8) if and only if =O and ae cae 

We denote by 4,(@) the directed “empty” arc on the circle K corre- 
‘sponding to s,(6*, which does not contain na-points with O<n<s. A,(8) 
has positive or negative sign, according to the direction in which it starts 
from the point §. We denote the directed length of 4,(@) by 0,(@) and the 
absolute length of it by 0,(6). 

If for an index v the inequality 0,(¢) 0,.:(@)<0 holds, we call this 
pair of adjacent multipla a pair of jumping multipla and denote it by 
Sy,(8) = x(8), Sx,+1(8) =9i(8).* For the corresponding 46,(8) we use the 
notation 0,,(8)=d;(@), 0,,+:(8) = di(6). For the sake of simplicity, in the 
case §=—O we use instead of s,(O), g.(0) etc. only s,,q, etc., respectively. 

From the definition of the adjacent multipla s,(@) it follows that for an 
arbitrary positive integer x=s,(@) (v=1,2,...) there is an s,(@)<x for 
which 7 

0,(6) = min |s,(@) e —8— y| < min |xe —6—y| 
; y y 
and a fortiori 
{2. 1) S,(8, 6,(8) <x|xa—S—y]. 

The homogeneous case. For the case 6=O we have proved in [3] and 

[4], as a simple consequence of Property A, the following 


2 By this convention the recursive formulae in (2. 2)—(2. 4) are valid also for k=1. 
3 [.e., if the s»(4)a- and sy+1(@)a-points approach the point ¢ from opposite sides. 
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Lemma |. Jf the s,a-point is adjacent to O and the s,-,a-point (I positive 
integer) among the «-, 2a-,..., S,a-points Is the nearest to O from the 


opposite side,* then 
Sy41 = Sy + Sy-iy 


Ovet = 0, + fe bab 
Further, as a consequence of Lemma | and Property A, we have proved 


LEMMA II. Let a, be defined by° 


(2. 2) a, = 
and let 
S=G=0, H=H=—1, V=G if S=—S2, 

then for the above-defined quantities we have for k==1,2,... 
(2. 3) Jest = Gert QnQx, Akar = Ak-1 + andk, Ges == de-1 — and, 
(2. 4) Qui dk + gids = 1, 
and for O<r<a 
(255) Soper =Gertrgn, Anjer=Aeitrdk, dyj+r—=de-1— de. 

As a consequence of Lemma II it follows 


dea 
d 


LEMMA III. If gi < Sy < Qui, then 
(2. 6) Gur Ast < Sy Oy. . 

These lemmas show that the above-defined multipla g, are identical 
with the convergents of @, the other multipla s, with the by-denominators 
(Nebennenner) of @. The numbers a, defined in (2.2) are identical with the 
digits of the continued fraction of a. 


From the definition of the multipla g, and from Lemmas I—II it 
follows the 


REMARK. a) The sequence d,,..., dx, ... has alternative signs, |d,|,...,|dx!,..- 
is monotonically decreasing. 

b) For an arbitrary N among the a-, 2a-, ..., N@-points the two adjacent 
points intercepting O have always the form with a suitable r and k. 


Sy-1@ =x, Sy@=(gi-1+7GQ.)a (O<rsa,). 
c) The (qx-1+ qx) @-points with O<r=a, are between the Qx-1@-point 


and the point O, in the arc 4,,_,, and with the restriction n < qs: only these 
na-points are in 4,, ,. 


4 Le. dydy-1 <0 and in the arc 4,+ 4y-1 there is no na-point with O<n< sy. 
5 [x] denotes, as usual, the integral part of the real number x. 


® I.e. Lemma Ill diminishes further the set of those integer x’s for which x|xa—y| is 
the “least possible”. 
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The inhomogeneous case. Since in the case when 6 = <na> the approxima- 
tion of @ by the multipla of @ is similar to the case 8—O, in the sequel we 
suppose that p+ <na@. 

THEOREM I. For every 0<8<1 one can determine uniquely a sequence 
of integers b,,..., b.,... with the property 
zd) 1<h3a4+1, 0=6.=a, (K == 2, 3.1.55); 

Onui=O0 only if b.—a,, 
so that the sequence of the adjacent multipla s,(8) is identical with the numbers 
(2. 8) Digit ees + Oy-1ge-i tran 
Yor O<rs by (k=1, 2, ...). 

Proor. In what follows we give a process for the determination of the 
numbers 5 (k= 1,2,...) from which the statement of the theorem follows. 

Determination of b;. The a-, 2a-,..., (a,+ 1) @-points split the periphery 
of K into a,+ 1 disjunct arcs. 

Case J. If ¢@ lies in the arc with length @ =d, bordered by the (r—1)a- 
and re-points with O<r=a,+1, then let 6,=r. 

Case 2. If @ is in the arc with length d, bordered by the (a,+1)e- 
and @-points, then let 6,=a,-+1. From the definition of 6, in both cases 
obviously follows that the ra-points (0<r=6,) — and with the restriction 
n=a,+1 only these — are adjacent to @. 

In Case 1 (6,—1)e@ and 6,@ are jumping multipla, i.e. in this case 

gi (8) = 6,—1 = (6,—1)q,, 9:(8) = 6, = 6,9. 

Next we determine 5; supposing that 0), ..., Dx-1 are already determined. 

Case k—1.]. If @ is in an arc with length d,-1 bordered by the 
(b:gi t+ -++ + (Or-1—1) Qe-1)@- and (6:91 +--+ + 6;-19x-1) @-points, then we 
consider the points with multipla 

Ogi tees + On-1Qx-1 +1: (OSer= az). 
According to Remark c) and Property A, these — and with the restriction 
n=bjqit::+ +On-1g%-1+4.g. only these — points are in this arc with 
length d;-1. We determine 6, in a similar way as 6, by distinguishing two 
cases : 

Case k.1. lf the point @ is in one of the arcs with length d, bor- 
dered by the (6:91 + +++ + 8-1Q%-1+(r—I) qx) @- and (0191 + +++ + Ox-19%-1 + 
+rq,.)a@-points with O<r=a,, then let 0,—r. 

Case k.2. If the point @ is in the arc bordered by the (619¢:+ ++: + 
+ B-1Qx-1tangxya- and (6:91 + +++ + (bk-1—1)gx-1)@-points with length dy_1, 
then let &, = ax. 
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Case k—1.2. If 8 is in the arc with length ad, bordered by the 
(igi tess +O4-2G%-2+4%-1ges)a- and (01g: +-++ +(Ox-2—1)gi-2)@-points, 
then let 5,0. (Since the first point with smallest multiplum which lies in 
the arc bordered by these points, is the (b1q1-+ -++ + Qx-19x-1 + Qx-1)@-point.) 

From the definition of 0, it follows, according to Remark c) and Pro- 
perty A, that the ((:g:-+ +++ + O4-1gx-1+7qx)@-points (0< r= 6) — and with 
the restriction 6:9: + +++ + On-1ge-1< 2 < bigit +++ + bx-1G-1 + Qxqx only these 
— are adjacent to £.’ 

COROLLARY. From the determination of the numbers 6, it follows that 
if Ox11 + 0, then S,(@)=bigit+::: + bx-1Gn-1 + (Ox—1) i: and S41 (8) = 
= 619gi:+---+6.g, form a pair of jumping multipla, i.e. with a suitable / 


(2. 9) Q(B) = bigit-->+(Ox—1)gx, gi(8)=bigit-++ + beg. 

If 6.410, then it is suitable to call also the pair of multipla 
(2. 10) qi(®) = sy (8) = digit ++ +b.gx, Gi(8) = S+(8)— Quer 
a pair of jumping multipla. 

From Property A it follows that for every index v the distance between 
the s,()a-point and the point O has the form 

‘ 

(2. 11) <Sy(8)a@> = bay + +++ + Og-1 dk +r (O0<r=&). 


Since the n@-points are everywhere dense on the periphery of K, the 
6-point is the limit of the s,(@)e-points, and so, according to (2. 10), 


(2. 12) B= 2 bth. 


From (2. 10) and (2.11) we obtain for y> 7, 


(2. 13) d,(8) = <s,(8)a>—B= rh — > b,d,8 


The following theorem gives an analogous result as (2.5) for the in- 
homogeneous case: 


LEMMA IV. Left 64.140, & > 1, O<r<b,—1 and 
(2.14) s,(8)=bi9i1+--- + Bx-19n-1 + (Ox—1) (==4:(8)), Sy-r(8) = Sr (8) — 19x 


7 It follows directly from the definition of the numbers 6, that for every index ” 
$,41(%)—s,(8) = 4, with a suitable /. Using this. remark, 6, could have been defined as 
the number of indices with the property s,,,.(3)—s,(2)=4,. 

8 The difference betwecn the treatment of Casse.s—Descompes and that given above 
for the inhomogeneous case lies in the fact that the mentioned authors start from an 
arithmetical definition of the numbers g,() and deduce from it the minimum properties, 
while we start from the minimum properties and deduce their arithmetical properties. 
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then we have 
(2. 15) S1(8)0,(8) < sy-r(8) dy--(8). 

If bie =0, (6. = a;,), let O0< r<b, and 

Sy(P) = big “+ see Bx -1Qu-1 ae Oni: (= qi(é)), Srl py S,(8)—rgx, 
then we have 
(2. 16) Sy(8)dy(8) < sy--(8)d,-r(8). 

Proor. From the definition of the numbers 6, it follows that 
0,(8)d,-,(8) > 0 and, consequently, from (2.13) and (2. 12) 

d,(8) = 0,-,(8)—rdk. 
From this and (2. 13) Y . 
(2.17) all a —|1-r—4 it +roe). 
Sy(8)d,(8) Sy(8) 0,(@) 

(2. 14) gives s,(8) >(6x.—1)qx. Further, from the definition of 6, and 6415-0 
it follows that @ is in the arc with length ad, bordered by the s,(@)a@- and 
(s,(@) + 9x)@-points. Consequently, 


(2. 18) d,(8) < dk. 
Using these in (2. 16), we obtain 
Sy-r(8)0,-+(8) i at ho ee 
s(8)3,(2) seal a at 


The proof of (2.15) runs analogously as the above proof of (2. 14). 


§ 3 
For the proof of theorems of Borel type we need the following 
LEMMA V. Jf 6:11: 0, then for 


(3. 1) q(8)=biqit--+bige, 9i(8)=9:(8)— quer 
we have , 
(3. 2) min (q:(8)di(8), 9/(8)di(8)) < =, 


Proor. Using the recursive formulae (2. 3) and (2.7), we have 
(3. 3) gi(@) S (ait Vqit sss +Oge = Geri +x; gi(8) = Qk. 

From the definition of the numbers 6, and 6,:;—O it follows that @ is 
in the arc with length dy41 bordered by the qi(@)e- and (g.(8) — Qusi)@-points. 


9 The same lemma occurs in Cassets’ paper [1] 
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Therefore 
(3. 4) di(8) + di (8) = dhs. 
Let ¢ be defined by 1 
(uti + 9x)t =x (dk-1—t). 
Obviously, from (3.3) and (3.4), using also (2.4) we get 


min (q.(8)d.(8), gi(8)di(8)) = min (gest Qx)ai(8), 9x (der: —A1(8)) = 


Jeti F Qk Gar Se ee 
Qi + 2Gx Qui t+ 2Qu Qui qx d,, 
ae Lae: ae 
Qk+1 Dist 


<= (quit o)t= Qi Aes1 < 


Since O0< si Ee: i ke: >1, it follows that 


Qk+1 Ais 

ee - 1 1 
min (q(8)4(8), 91(8)dE(8)) < [*—-—__< 
Qx+1 fioues 

Qk+1 


From this proof it is easy to see that the constant = is best-possible. 


THEOREM II. For every pair of jumping multipla we have 


E : 2 
(3. 5) min (q1(8)4(8), gi(8)ai(8)) <3 - 


Proor. Owing to Lemma V we may suppose that the pair of jumping 
multipla qi(@), gi(@) has the form as in (2.9). Similarly as in (3.3), we have 
Q(B) = Qui, 9i(@) S Qeii+Qx. 

Similarly as we obtained (2.17), we have 
Therefore, if ¢ is defined by 


Qurit = (gi + uss) (€k—t), 
we have 


min (qu(8)4(8), gi(8)di(8)) = gaat = ye EO gy dh, 


From this, taking (2.4) and z= <1 into account, it follows the 
k+l 


statement of the theorem, and also the fact that the constant 4 is best-possible. 


THEOREM III. For any two consecutive pairs of jumping multipla the 
inequality 


min (.(8)&(8), 9i(B)d(B), quea(B)dua(B), afi (B)diss (8) <4 


holds. 


ON THE THEORY OF DIOPHANTINE APPROXIMATIONS, II 237 


By other words, the inequality x|jax—@—y| < = has a solution among 
any two consecutive pairs of jumping multipla. 


PRoor. Owing to Lemma V we may suppose that both pairs of jumping 
multipla have the form as in (2.9), i.e. 


q(@) oo bq: a + B41 ets + (b:—1)Qx, qi(e) = qi(8) +4; 


gisi(P) = qi(4) =e (Ox41 —1) ust , Jiri (8) = gi(@) + On Qis- 
Similarly as in (3.3), we have 
qi(@) S Qeu, gi(@) = Quit Qn, 


ON, gisi(8) S get Orsi Gurr,  is1(6) S Qe t+ (Oras + WI gust. 


Let u be defined by dj.1(@) =udys1. According to (2.17) O<u<1 
holds. 
From (2. 13), taking into account that the sequence di,...,d,,... has 


alternative signs, we have 
d,(8) = dk —(Bxs1 —u) dest , di(8) = (0x11 —4) dest, 


das(8) ml n)iieas, dis(8) =ude,s. 


With the notation x ——% ee 


kt Qk+ 
(3.6) and (3.7), using (2. 4), , ta aj 
gr(8)d:(8) S quest (de—(On41 —P) dest) = Ques dus( = — (8x41 —n| = 


k+1 


» b6=by11 we have from 


1 dk 
ee | eee |, 

qk di, io ete") 

Qk+1 Ais 
(3.8) (8) (8) = (#6 +0) F(x, y, by). 
Similarly 
(3.9) qi(8)di(B) = (1+ y) (O—u) #2 F(x, 9, 6) 
(3.10) qu (B)dinn(8) S = (+9) (1—u) #4 Fala ¥, 6, 
(3.11) gisr(8)di1(8) = ree (1+ b-+y)u %! F(x, y, 6, 1) 


10 8 is in the arc with length d,, 41 bordered by the g,,,(@)a- and q7, ,(@)e-points. 
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where 
(3. 12) (a.<x<a+l, O<y<l1, O<bSQq, 6 integer). 

Since from (3.12) we get (1+y)(6—u)=(6+y)(1—u) and conse- 
quently F, = F;, for the proof of the theorem we have to show that with the 
restriction given in (3.12) for (x, y, , u) 

1 
m 
holds. It follows obviously from (3. 8)—(3.11) that if for a value of (x, y, 5, u) 
for any pair i--k also F;=+F;,, then one may change the value of uw so that 


min (F,, F;, F,) increases. This is the fact also in the case when F, =F, < F;. 
So for the determination of sup min(F,, F;, F,) we have to investigate the 


sup min (F;, F;, Fs) = 
x, y, b, u 


following two cases only: aah 
rads == feel, 
PA Ped Fi or 
Case 1. From F,=F; it follows x—b+r=(y+6)(1+)), 
pa FE20E | _odenba ls 
Fedele yin 


and consequently in this case 


1 x—b+1 1 +2b—x 
SB. 13) Fy Se Bye — (Boe) ee we y = 
Sate. ge mere ck aes Peay cos ok hy te eae 
and, since F, = F; = F,, therefore (6+ y)(x—6+ 1) =(14+6+y)(y+26+-x), 
re 
3.14 << _ (yee bye 
oat) <= 5) Lop cle 
From b= 1 it follows that 


Foae ee eee — (1245-1) b+y 
s x+y 1+464+y x+y Ji+b+y 


is monotonically increasing in x. Putting therefore in (3. 13) the upper bound 
of x, from (3. 14), we get 
(3. 15) Pp eee hha 


3y+36+1 = 2° 
In Case 2 we can obtain in a quite analogous way the same expres- . 


sion of y and 6 as an upper bound for the minimum in question. These 
together prove the theorem. 
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From the proof it follows that for the values 


b= Dx+1 =] ? 
y= eS (a, large), 
Qx+1 
t= — ~4+ (Qis=1, Qhy2=3, Aus large), 
phe 
3 


we have R=R=h~s, i.e. the constant is best-possible. 


THEOREM IV. For every positive integer | there exists a suitable irrational’ 
@ and a real 8=-<ne> so that with arbitrary «>0O for an infinity of k, the 
inequality 
; = = 1 
min — (qx(8)a.(8), ge()di(8)) > ih 


ky k<hky V5 
holds. 
1 


By other words, the inequality GS ted pec cannot be sa- 
tisfied among the / consecutive pairs of jumping multipla and, according to 
Lemma IV, also among the numbers x with q:,(8) < x < Ginu(A). 


Proor. The theorem follows easily from the following 

LEMMA. Let ¢ be an arbitrary small positive number and the integer M 
sufficiently large. If for an @ and 8 and for k—2MSv=k+2M (k>2M). 
we have 
(3. 16) a, = b, = 1, 
then putting 

gx(P) — gi.-1(8) => bigi =f oe fa On -1Qu-1 , 

eases} 
/5 


the inequality 
gx(@) a. (8) > 
holds. 


PROOF OF THE LEMMA. Using the recursive formulae (2.3), we obtain 
according to (3. 16) 


k-1 k-1 k-1 


(3. 17) Qu (8) = 1g +++ + Ox-1Gn-1 < bdr = qv = XO oe 


v=k-2M vk-2M yk-2. 
k-1 


a! ps (Gv41 — Qv-1) = Je + Qu-1 —Qu-2M — Ju-2M-1 = Yrs — Qos > Qari (1 — &): 


v=k-2M 
where «’ is arbitrary small if M is large enough. 
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Similarly, for d.(@) we have from (2.3) and (3.16) 


o k+2M-1 @ 


== = v Dyaee 
tO dent oe ee 
Since 
k+2M-1 k+2M-1 k+2M-1 
DS d, = o. a, dy = (A141 — dy. 1) =—dy-1 —d + doy_1 + doy = 
yok vk v=k 
——) — Ass sO domsi 
and 
| He by d, | = Duane us osae == Oran | 
v—kpeM y=0 
we have 
(3. 18) (8) > Gert —iso0-1—derom > dei (1—e”) 
where é” is arbitrary small if M is large enough. 
From (3.17) and (3. 18) we get ; 
x(8)dk (8) > Gur desr( —a’)(1—e”) = =— (1—e’)(1—e”). 
Qk 4 dx 
Qk+1 dys) 


Since the first 2M digits of the continued fractions of —7*— and —2_ 


are the same as those for the numbers Gees dus 
V5—-1 1 «1 V5—1 | 1 1 
Die La ae a Lea sien 
respectively, we obtain 
1 1 ; 1 
3.19) —————__ 5 = 1—e”’) =— (1— e"", 
eo qk a V5—1 ye—1 | ys‘ 
——f— Oy 4+R 
Qk+1 Dist 2 2 


From (3.19) the Lemma follows if M is so large that 
(1—e’) (I—e”) (l—e””) > (I—). 
Theorem IV is a simple consequence of this. Namely, if in the sequence 
a, (k= 1, 2,...) we have for an infinity of indices v 
Ay = Ay41 = *+s = Aysomy = i 
this means that the conditions of the Lemma are fulfilled for / consecutive 
indices kj+1,..., k)+/ and for infinitely many k,. Further, if for infinitely 


many w-indices a, + 1 and 6b, =a, 6. == 0, then, as one can see from the 
definition of the numbers 6, 8+: <ne>. 


(Received 6 March 1958) 
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NOTES ON INTERPOLATION. IV 
(INEQUALITIES) 


By 
J. BALAZS (Budapest) and P. TURAN (Budapest), member of the Academy 


§ 1. Introduction 


1. In this paper we continue the investigation of the interpolatory poly- 
nomials R,(x) of degree =2n—1 for which 


iat.) R,, (xy) = &, = prescribed 
and (v==21,2,.. 5, 2): 
(1. 1. 2) Ry (x) ==8, = prescribed 
Here n is always even and the values 
ye ey) 1m XS Xp? eS Xp eS! 
are zeros of the polynomial 
(1. 1.4) I1,(x) = —n(n—1) | Pri()dt=(1—**) Psi), 
=1 
P,,1(x) being the (n—1) Legendre polynomial with the normalisation 
te? 5) P,-1(1) = 1. 
We may write 
(1.1.6) Ro(x) = D erto(x) + 2 BrOr (2), 
where the fundamental polynomials r,(x) and @,(x) are defined by 
11.7 bie steeandta for all /’ 
(1. 1. 7) rAXD=] 9 for fey and r,/(x;)=0 for all j’s 
and 
1.1.8 Cr tT ee ee 
(1.1.8) oy(x;) =O for all j’s and 0(x%j))= nities freee 


x) and 0,(x) are uniquely determined.’ It follows from 


respectively. These 7,( 
is an arbitrary polynomial of degree <=2n—1, then 


this fact that if ztan-1(x) 
(1.1.9) Dy on 1%) Fo) + D 7-1 (%) Or) = An-1(2), 


v— 


Based on this we shall prove the following theorems. 


P. Turan, Notes on interpolation. I (On some interpolatorical pro- 


1 J. SurAnyr and 
als), Acta Math. Acad. Sci. Hung., 6 (1955), pp. 67—79. 


perties of the ultraspherical polynomi 


1 Acta Mathematica IX/3—4 
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THEOREM I. Jf for v1, 2,...,2 we have for a polynomial t2n-1(X) of 
degree =2n—1 
Ch 1s 10) | 72n-1(X,)| SA, | 705n-1(X»)| = B, 


then for —1\=x=-+1 we have 


| 702n-1(X)| <=z7'nA += B. 


This theorem will follow very easily from the estimations of the previous 
paper of this series.’ It will follow further easily that this theorem is essen- 
tially best-possible, i.e. for a suitable polynomial f,(x) of degree =2n—1 
and numerical positive c 


B 
16(0)|>e(n+ 2). 
More difficult is, however, the estimation of 


max | 7a) 


-1lsSrS+ 
We shall prove the somewhat unusual 


THEOREM II. Under the condition (1.1.10) we have for —leEx=S+1 
the estimation® 


|7.-1(x)| S8n"™-A+n°)/n-B. 


Unusual is the appearence of the exponent 5/2; that this is really con- 
nected with the matter, will be shown by constructing a suitable polynomial 
fi(x) of degree =2n—1 satisfying (1.1.10), for which 


[A(1)| >c(An? + Bn") 
with a suitable numerical positive c. If, however, we consider only 
max =| 70n-1(X)| (0<e<1), 


-l+eSal-e 
S. BERNSTEIN’S inequality gives at once from Theorem I! that for —1+ées 
=x=1—e we have 


2 2 
ba Pe 8 | J03n-1(x)| S =20'n*?-A+—n'. 
Finally, we shall show that this is also essentially best-possible, too, i. e. for 


2 J. BatAzs and P. TurdAn, Notes on interpolation. III (Convergence), Acta Math. Acad. 
Sci. Hung., 9 (1958), pp. 195—214. 

’ For the sake of orientation we remark that if in [—1, +1] f’(x) exists everywhere 
and here |f(x)|/S! and |f’(x)|<1, then we have for [—1, +1] |f’(x)|=2. This has been 
proved after the first results of C. N. Moore and Harpy - Litttewoop by E. Lanpau (Einige 
Ungleichungen fiir zweimal differenzierbare Funktionen, Proc. London Math. Soc., Ser. 2, 
13 (1913), pp. 43—49). 
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1 suitable f,(x) of degree =2n—1 satisfying (1.1.10) we have 
\f2(%0)| > c(An* + B) 
with a numerical positive c; here m is ‘‘near” to 0. 
We are indebted to Mr. G. FREuD for his valuable remarks. 


§ 2. Preliminaries 


1. The explicit form of the fundamental functions 7,(x) and @,(x), what 
we have found in ’, is the following: 


2.1.1) a) = — ages 1+ Peel, 
i. 1.2) On(X) = aay 1 ty Par) 
and* for 2=v<n—1 

060) Se SPL) |. Pill gy 
eh) + Pra(s)(— Spelt + 

+(-sSztaomeneol 

and 

e0)— are SP) | Pall) ay 
(2.1.4) ve. 1@)(— 4 + ei) 


] 
lene. Um 
respectively. Further, if 


IT,.(x) 


(2. 1.5) WO) = Ti ,)(x—x) (¥ =1; 2,549 7) 


stand for the fundamental functions of the Lagrange interpolation based on 


4 (1.1.4) gives that the integrand of (2. 1. 3)—(2. 1.4) is a polynomial. 
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our x,-points in (1.1.4), then we have 


r(x) = 3 nay —1* nek + 


(2.1.6) ; evar 
+(S+aag=y) IT, (x) ! + P..c0| , 
ral) = FE baat + F* bo) + 
(ater) 


and for 2=yv=n—1 and x<x, 


(2. 1.8) re) — La | L(t) at— (5+ 720) 1 


Ti (x,)|J (t—x,)° 2 6 IGP 


and for 2=v=n—1 and x>x, 


me ACOn WEE) 1 Pra) I : 
(2.1.9) A re oes: at+| > r ar ft 


respectively. 


2. We shall use some well-known facts about Legendre polynomials. 
For —1=x=+1 we have° 


(2. 2.1) (een 
and S. BERNSTEIN’s inequalities® 

Pip Ae 
and for n=4 
(2. 2. 3) (1—x2)""| Pyx_s(x)| SV 22, 
(2.2. 4) \11,(x)| < |/ ain 
Further, for —l1=x=-+1 we need’ 
(2. 2. 5) Peet ea)! 


5 See e.g. G. Szeaé, Orthogonal polynomials, Amer. Math. Soc. Coll. Publ. (New 
York, 1939), p. 167, formula (7. 33. 8). 

® S, Bernstein, Sur les polynémes orthogonaux relatifs a un segment fini. Il, Journ. 
Math. pures et appl., 10 (1931), pp. 219—286. 

7 See G. Szeaé, |.c., p. 159, formula (7. 21. 1). 
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and the differential equation® 


(2. 2. 6) (1— x") Pix) — 2x Pin (x) + m(m + 1)P,,.(x) = 0. 
We have further for » — 2, 8, oes and n=4,6,8,... the estimation? 
(2. 2.7) aye ae 
We shall use further the estimation? 
(2. 2. 8) max > |r,(x)|<z'n 
-lSrS+1 v=1 
and that for a suitable positive? numerical c 
(2. 2. 9) ma |r,(0)|>cn, 
further? that : 
(2. 2. 10) max > o,(x)|s = 
-lSr=+1 y=1 n 
and? with the above c 
(2.2. 11) > |e-(0)|>—. 


We shall also repeatedly use MARKOV’s and S. BERNSTEIN’s inequalities, 
according to which for a polynomial g(x) of degree =m and real coefficients 
we have for —1Sx=+1. 


(2. 2. 12) ig) Sm max |g(x)| 
and i 
Pees Bel 
(2. 2. 13) lg (x)|= Wie max lg(x)|, 
respectively. A 
Further, for the fundamental functions /,(x) from (2.1.5) we have* 
(2. 2. 14) Wey Ss LO S1 
yal 


(—1Sx= +1, n—4,6,8,..., j=1,2,..., 2). 
3. We shall need further something about the Hermite—Fejér interpola- 
tion based on our x,-points.”” This is the polynomial of degree =2n—1 


8 See G. Szeaé, |.c., p. 59, formula (4. 2. 1). 

9 L. Feyér, Bestimmung derjenigen Abszissen eines Intervalles, fiir welche die Quad- 
ratsumme der Grundfunktionen der Lagrangeschen Interpolation im Intervalle ein méglichst 
kleines Maximum besitzt, Annali della Sc. Norm. Sup. di Pisa (2), 1 (1932), pp. 3—16. 

10 L, Fryer, Lagrangesche Interpolation und die zugehdrigen konjugierten Punkte, 


Math. Annalen, 106 (1932), pp. 1—55. 
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whose function values and first derivatives are prescribed numbers y, and 
y,, respectively (v1, 2,...,). This polynomial is always uniquely deter- 
mined and has the form 


Q, (x) = = yr hy (x) + Ds yi by(x). 


In particular, if the y,-values are values of a function f(x), we write 


(2,341) H,(f,x)= Dseeyhole) + > yotw(n. 

The polynomials A,(x) and h,(x) are of degree =2n—I1 and 

(2idu2) > h,(x)=1 

holds; more generally, if g(x) is any polynomial of degree =2n—1, we have 
(2.3.3) S o6s)h) + D9’ dbo =o. 

As FEJER I. c.° proved, we have for y1,2,...,2 and —lS=x=+1 

(2. 3. 4) h,(x) 20. 


§ 3. Investigation of the derivative of the fundamental functions 
of the second kind 


1. In this § we shall estimate the quantity 


& lo+(x)|. 
It follows immediately from (2.1.1) and (1.1.4) that 
, 1 IT,(X) py, | 
6) =—aaiay i ) Pi-s(2)—n(a—1) Px) +5 Pnst|| 
and using (2.2.4), (2.2.5) and (2.2. 1) 
| 
Keg | 1(x)|< — ; 
(3.1.1) Ol < Ep 
valid for n= 4,6,8,... and —1=Sx=+1. The same holds for |0/(x)}. 
For the further fundamental functions we have the 


LemMMA 3.1. For n=4,6,8,...,. —lSx=S+1 we have for2srvs 


1 
vy Ye 
evo) s 1540-5 +4l/* | (1.cora0) 
-1 


Bs 
2 
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and for Stisrsa— 


ie oe "(J (rat) 


PRooF. It is sufficient to consider the case 2=v= S: From (2. 1. 4), 
(1.1.4) we have 


|e; 


° Ps, () 
(= a7 ae (xy) 5 Jaa) J name ap 


+ Pee) (— ae Seer ed Fe 


(3. 1. 2) 3 (1—x5) Pa-1(X») 


= a ae 


+1) (2 +. Phe (——™ x 3 Us Awl) 


We split it into parts 
n(n—1) Py-1(x) Pe Pe dt, 


(3.1. 3) Bec 21%) Pri), 
dp 15-4 «Ses | pets ee 
j= 217; (xe) (1—=x5) Po 1(X,) |Pe ns) [* 3P,-1(Xpy) J+ 

(3. t. 4) 

+ P,- (1 ip Ree ral 

= IT,(x) Pr-1(X) 
(3. 1.5) Je= SI) Pe) X—Xy’ 
bape! 10) ;cer\ 3 a (a OO 

£3. 1.6) h= QI (x) Pes (x») (13) ( oy aE Ee *) 


2. As to J, we have from (2.2.6) and (1.1. 4) 
1c (1—x*) Pa-s(x)P_ 1 — 3X Pn-1(X) 
2n?(n—1)? Pn-1(X,)’ Ori (y) 
(2.2.5) and (2.2.13) give for —I1Sx=+1 
(1—x") Pn-1 (x) S (a —1) 
and thus, using (2.2.5) and (2. 2. py 
Vv. 


(3. 2. 1) il s1620 s2n—,. 
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For J, we have from (1.1.4), (2.2.6), (2.2.5) 


2 
Wel < aI) P a DP 
and hence from (2. 2. 7) 


rh 
(3. 2. 2) |< T2778 = 94-7. 


The estimation of |/,| and |/;| is much more difficult and needs another idea. 
We represent 

Pr-1 (x) 

X—Xy 
which is a polynomial of degree n—3, as a Lagrange interpolatory poly- 
nomial taken at our x;-numbers. With (2.1.5) we have 

Ps-1(x)_ Pa-1(1) , Pr-1(—1) 
(3. ay 3) ae = arom a Px-1(X») 1, (x) —_ ehid-xs > fA): 
Using this, (2.2.1) and (2.2. 14) we obtain 
| Tn (x)| (aes n(n—1) |- 

Usl= au (%) PaG%)| \2(I—x,) + PC + aay] = 
AE, n(n—1) IT,.(x) | eee 
2 |LTa(x»)|(1—xy)| Px-a(»)| ae 
using also z 2 ry (1.1.4), (2.2.6) and (2.2.7). For J, we get from (3. 2. 3) 


B24) 


, 


(3. 2. 5) {Be Oar —7 : 1) (Ndt-+ P4(x,) fi ()dt— Pte fy (fat. 


1 


(2.1.5) and (1.1.4) give 


fi (t)dt — 


a dt = waif +1) Pis(dt= 


anet ars nck, Pata , 


1 


1, €. from: (2. 2, 5) 


(3. 2. 6) June < roan 


Lal 


and similarly 


(3.2. 7) fuer < ee 
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Since 
toa = 1a fra 


we have from this, (3.1.3), (3.2.5), (3.2.6), (3. 2. 7), (1.1.4), (2.2.1) and 
(2, 2.6) 


n(n—1)|Pr-1(x)| 


Als MPa)! YParQ)| 6 —, |Pai(—1)| 6 
Gee 21021) Pris) | 


1—x, n(n—1) * 1+x, a(n—}) 


+ 
+|Pala(xy)|/T—x (| neorat) | = <5 Reyt 


 2[Pai(%)| 


4 VI=x|Paa@)| | J won) 


(2.2.5) and (2.2.7) give 


1 


(3.2.8) | jl=3207 “+ \2ze7 V—x) | Pr- 1ci( Joona) 


(3.1. 2), (3.1. 3), (3.1.4), (3.1.5), (3.1.6), (3.2.1), (3.2.2), (3.2.4) and 
(3. 2. 8) give for 25st, —l=x=+1 


(3.2.9) |o,(x)| $1542, + V2e(i—x Pe | fara 


Actually, we shall use it only for O<x=1; for —1=x=0 we shall use 
the estimation 


(3.2.10) |e6(x)| 51540, + ae FH) |P.G)|V? (Jucra) 


which one obtains similarly but starting form the representation (2.1.3) in- 
stead of (2.1.4). Since for O=x=+1 and for —1=x=30 we have 


yi—x= foe ali=x x and Vi+xs/si—~x, 


respectively, (3.2.9) and (3.2.10) give for —I1=x=+1 


les(x)| 15420 5 + /20(1—X) | Pr cova ( Jor) 


Then (2.2.2) proves the lemma. 
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From this we easily obtain 
LEMMA 3.2. We have for n= 4,6, 8,... 


& lex) <0°Y a. 
Proor. From (3.1.1), (2.2.14) and Lemma 3.1 it follows 


and —1=x=-+1 the estimation 


1 
LeMay wan 5 + 58-r Vn + 8 Sy ({ucrat) soon taal 
2 
-1 
using SCHWARZ’s inequality. 
3. Next we show that Lemma 3.2 is essentially best-possible. This will 
be shown by 
LEMMA 3. 3. For all sufficiently large even n’s we have 


2 ler(1)|> ela 
with a positive numerical c. 
ProoF. For 2sve5 we have from (3.1.2), (1.1.5) and (1.1. 4) 


+1) aoe hl) ee ee eee 
a0 GABE Cee (1—x5) Pn-1(Xv) i) 


i.e. using (2.2.6) and (1.1. 4) 


1 2 1 
leo aay sax lS Rta 2). 


£] Sy = 2 | we have 


Prd <e 


Since for all sufficiently large n’s and 


we get for such v’s 


le-(1= saa POG 
(2.2.2) gives then n-1(Xy)| 
nu aes 


1er(1)|> 15 ines. y", 


Diesayi> < lor ()|>cVn. Q.e. d. 
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Further we need the following 


LEMMA 3.4. Denoting by n the smallest positive zero of IT,(x) we have 
for all sufficiently large even n’s 


= |0%(7)| > 
with a numerical c. 
Proor. (2.1.3) gives for 2=v=n—1 


, —_ n(an—1)Pa-s(t%) m- fe 
(0) = — SIT, ) Pina (x») fe el fe 


4 1— 4. SR) aad i ae P(x) : 


Restricting again v by E sve BE we get from (2.2.5) 


(3. 3.1) 


8 4 
n-1(f) Pee eae, ee ole 
shes a a|— ee Phe i lx, 
and thus from (3.3.1), (2.2.5), (1.1.4) and (2.2.6) 

‘ggupriey Dramas) GORI) |S) ca nal en ey 
Sed 2|ITA(Xr)|(1—xy) | Pai (xr) | | | Pui >)| 3| Pn-1(X»)| . 

= |Pn-a(%o)| i a 12)> |Pn-1(%o) | 

= (a—1)a|Pru-1(x%)P (3 |Pa-1(%)| 6n(n—1)|P,-1(x,)|* 


for all sufficiently large n’s. Applying, (2.2.7) and (2.2.2) we obtain with 
a numerical c 


|@(n)| > — 


3 [4] 
> |e(n)| = ad len) |> Q.e.d. 


and thus 
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§ 4. Investigation of the derivative of the fundamental functions 
of the first kind 


1. We shall start with a general observation valid for any of our r,(x)- 
polynomials. We represent it as an Hermite—Fejér interpolatory polynomial 
defined in (2.3.3). This gives owing to the definition of r,(x) 


Cs BD) r(x) = > 1(X;) A; (x). 
Using (2.3.2) and (2.3.4) we obtain 
(4.1. 2) (r(x) | = max|75(x)]. 


Actually, we have even 


(4. 1. 3) max |r,(x)| = max |r,(x;)|, 
~Il=r=+1 j 


i. e. all polynomials r,(x) attain their absolute maxima with respect to 
[—1, +1] at one of the x;-points.. The use of (4.1.2) consists obviously 
in the fact that we have only to estimate the numbers |r;(x;)| which are 
owing to our explicit formulae much easier. 


2. We shall first prove 

LEMMA 4.1. For n=4,6,8,... and —1=x=+1 we have 
Iri(x)| S477, 
\r.(x)| S4n?. 


PROOF. It is sufficient again to discuss the first. Owing to the remark 
(4.1.2) we have to estimate only 


max |r;(x;)|- 
For 2=j=n we have from (2.1.6), using (1. 1. 4), 


9 
1—x; 


A(x) = — Ry 


(4. 2. 1) ; 
— (e+ sae) 2D Pats (1 +$P.iG)). 
Since from (2. 2.14) and (2.2.13) we have 
(I—¥) h(x) S(a—1), 
1 A similar remark holds instead of our x,-numbers for any point-system, which 


Fejér calls normal point-systems, supposed that for this s i i 
! ‘ ) ystem the (0, 2)-interpol 
uniquely determined. For the normal systems see 10, acaba nc 
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(2.2.5) gives from (4. 2.1) 


<n’. 


n(n—1) 4 
“3 


(4. 2. 2) In@ys SGP 4 Ae 


Further from (2. 1.6) 
, 1 ‘a) ’ 
BU) a teh) — i ae eee 
i.e. since from (2.2.14) and (2. 2. 12) 
lA(1)| S(a—1)’, 


we obtain 
ini(1)|<4n’. 
This and (4.2.2) prove Lemma 4. 1. 
To the further fundamental functions refers 


LEMMA 4.2. For n=4,6,8,..., —l1S=x3S+1 we have 
n ne n 
r,(x)| S 662°: — + 3482— for 25 v=—-, 
Ir-(x)| i =i a! ; 
n’le n 
r;(x)| S 66207: —_— t——,- for —<yvsn 
Ir(x)| = Teas 38 oe for 


Proor. It is sufficient again to consider the case 2=r= >i ; let first 


be n=8. We use again (4-1.2). The representation (2.1.8) gives for f>yv, 
using also (1.1.4), 


of) 
5 Pasi X;) l, (0) ( 1 ae 1 
4.2. 3) r(x;) = ——— } | —* at — | — + | MS 
¢ ) ( ») Pr-1 (Xv) (t—x,/ 2 Me 6 (=x Po), ; 
~1 
and for j<¥ from the representation (2. 1. 9) 
x; 
; P-1(%) L@ l aa) 1 
4.2.4) r(x) = 5 | — SS at F+-_ | — — ——*]—-———_ 
( ec) Py-1(Xv) | (t—x,) ‘ 2 6 Mea) Pie) al: 
1 


respectively. Using (2.2.5), (2.2.14) we get for j>y 
ty a ele ait Bapew ers reine «+n 
| Pa-1(Xy)| Xy — Xv4t 3 (=< )PAbey 


But we have with an x,.,;5A=x, 


(4. 2. 5) [73(x;)| = 


1 12h )—b (Xy41) aT 
ee et Or 
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i.e. using (2. 2.14), (2.2.13) and” with the notation X»y=cos 9, 


oe n nm on n nr 
1 n—1 n = ts 


%—Xa1 Vie Vises sid.) 2 «oleae eee 


Putting it into (4.2.5) and using footnote * and (2.2.7) we get 


2 
(4. 2. 6) Iri-(x;)| < 6620 
Vv 


For the case j< we have to proceed analogously, starting, however, from 
(4.2.4) instead of (4.2.3). For jy we have” from (2. 2.13) and footnote* 


, _|f/n  2n—1 ni 
Fo(x)| 812 | % Vie < 348.1 =. 


Vv 


(4. 2. 7) 


From (4.2.6), (4.2.7) and (4.1.2) our lemma evidently follows. 
From Lemma 4.1 and 4.2 it follows evidently 


LEMMA 4.3. For n=4,6,8,... and —1=x=+1 we have 


nn 
> |-(X)| S28 nh. 
v=1 


In order to show that the estimation of Lemma 4.3 is essentially best- 
possible, we prove 


LEMMA 4.4. For all sufficiently large even n’s we have 


& |P(1)|>cn"s 
v=1 
with a positive numerical c. 
Proor. (4.2.4) gives for 2srs5 
l 


TET 30) PCN 


4 
for 0< 3, = — whi 
alain eee which follows at 


once from Bruns’s well-known inequalities. See 2, formula (2. 4. 8). 
13 Here we use the estimation 


|r, (x)| S872 | for 2<0= 
v 


12 Here we use the estimation o> (--3} 


n 
2 ’ 


17,@)| 87% |/ e)- for <esa, 


n—yv 


valid for n== 4,6,8,... and —1=x=+41, which is proved in 2? (Lemma 4. 2). 
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Hence (2.2.2) gives with a numerical positive c 


[i E] 


& |ro(1)|> aA In(1)| > rae 


| a he 
3 G Jon: (PES ileal 


4 8 
indeed. 


Further we need the 


LEMMA 4.5. Denoting again by 1, the smallest positive zero of 1,,(x) 
we have for all sufficiently large even n’s 


a I (Mo)| > en? 
v—l1 


2) <y2[* 
8 4. 


"lo 
l(t) 1, Pa-1(%) 
See CL | >}. 
(t— xe ( 2 di 6 | (1 2853) P: -1 LxP)* 


with a numerical c. 


Proof. From (4.2.3) we get for 


Pr-1(No) 
P5300) ; 


Hence, using (2.2.5) and (2. 2. 14), 


(a0) = 


n 


t [F] 1 | 
(4. 2. 8) > |7o(%e)| > |Pa-s (7) eon \P,. i 13(1—x,)! Pa-1(x) a 


since for our »’s, for all sufficiently large n’s, 


eos 1 = 7 < 10. 


Since owing to (2.2.2) we have for our v’s 


1] To n—l 


3 72 eo 540, 
| 3(I—x5)|Pa-i(%)/ 6 VIX, 
if n is sufficiently large, this gives from (4.2. 8) 
| 75%) | > [Pa-s(to)| a Gi Abies Se > c|Pa-1(%)|n"2, 
Dlel> Fay =P Goh 
8 


as in Lemma 4.4. Thus (2.2.7) completes the proof. 
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§ 5. Conclusion of the proofs 


1. Owing to (1.1.9) Theorem | follows at once from (2. 2. 8) and (2. 2. 10). 
That Theorem I is essentially best-possible, is shown by the polynomial 


Jule) = D sign r5(0)-r4(2) + & sign on(0)-00(2) 


for x =O owing to (2.2.9) and (2. 2.11). 
Since from (1.1.9) we have 


TOan-1(X) = os TE2n-1 (Xv) F(X) + pz TEn-1(Xv)0;(X), 


Theorem II follows at once from Lemma 3.2 and 4.3. That Theorem II is 
essentially best-possible, is shown by the polynomial 


fils) = BS sign 41-768) + D sign e6(1)-0(2) 


for x =1, owing to Lemma 3.3 and Lemma 4.4. That (1.1.11) is essentially 
best-possible, is shown by the polynomial 


fale) = & sign r4(m)-ro(a) + > signee n)-e6(2) 


for x=, owing to Lemma 3.4 and Lemma 4.5. Here 7 stands for the 
least positive zero of /T,(x). 


(Received 6 February 1958) 


NOTES ON INTERPOLATION. V 
(ON THE STABILITY OF INTERPOLATION) 


By 
E. EGERVARY and P. TURAN (Budapest), members of the Academy 


1, Let 
(1.1) L2% > Xe oo > Xy = — 1 
be n points in [—1, +1] and 
(1. 2) Fa (%), Fela); ©. ; Ta(X) 
polynomials with the property 
(1.3) r(x) =| for JOE, 
Then for arbitrary real y,’s we have for . 
(1.4) Ru(x) = D ore) 
the relations > 
m5) R(X) = 9} (f= 1,.2,-40.5 2). 


The polynomial R,(x) we call an interpolatory polynomial, the points x, the 
n‘” fundamental points, the polynomials r,(x) the n fundamental functions. 
A classical example is furnished by the Lagrange interpolation where with 


(1. 6) o (x)= [1 «—x) 
we have 
(1. 7) Ty (x) = See) =O 


i.e. all fundamental functions are of degree n—1. Another type of inter- 
polatory polynomials is due to HERMITE and extensively investigated by FEJER, 
5ZEGO and others; here is 
1.8) Pity ( fae) (x) oy, 

ow’ (Xy) 
.e. all fundamental functions are of degree 2n—1. FEJER discovered that at 
certain choices of the ny fundamental points his interpolatory polynomials 


FQ) = Z ohel) 


lave a remarkable stability property, whose importance for the study of 


2 Acta Mathematica IX/3—4 


260 E. EGERVARY AND P. TURAN 


experimentally given functions is obvious. This asserts that for any real y, 
and y; we have for —1Sx=+1 


min (y,—ys) = (> Yolhty()— 2 Yho(2)| = max (Yr —Y>)- 
The Lagrange interpolation has according to a theorem of G. FABER’ never 


such a stability property.> Generally we call the procedure (1.2) a stable one 
if for arbitrary real y, and y, we have for —1S=x5S+1 


(1.9) min (Yr—Yr) = (> VT y(xX)— = Voly (| = max (y»— >). 
We define the degree deg R, of the interpolation process (1.2) by 


(1. 10) deg Ri = pa degree of r,(x). 
In this note we intend to determine the ‘most economical” interpolation 
process, i.e. which is stable and deg R,, is minimal. In our solution essential 
role is played by the n—2 simple zeros 
(1.11) (1=8 >) >>> h1(>5=—1) 
of the (n—2)" Legendre polynomial P,,-2(x) (which we always mean with th 
normalisation . 
(1. 12) P,-2(1) = 1 
in the sequel). We assert namely the following 
THEOREMI. The minimal degree of a stable interpolation process (1.2) is 
2(2n—3) + (n—2) (2n—4) = 2(a—1)’; 
this is attained if and only if the fundamental points (1.1) are given by 
E, &, 2.6, Sn 
iT mere ees 
Hence our theorem gives a new interpolation-theoretical characterisation 
of the zeros of the Legendre polynomials. The first such characterisation was 
given by Gauss and JAcosi with the aid of mechanical quadrature. 
The most economical interpolation process is given by 


Raa) = 9 a Pr 2+ In a P,-2(x)? + 

(1 : 13) n-1 1 x? P x) 2 a 
+ w i : ( al ) = z oo 
= ‘ 1—&, \ Pr-2(E.)(x—&) J =” u( ) 


1 Uber die interpolatorische Darstellung stetiger Funktionen, Jahresb. der Deutschen 
Math. Ver., 23 (1914). 

2 This was in the particular case of equidistant abscissae emphasized by H. Haun. 
See his paper: Uber das Interpolationsproblem, Math. Zeitschrift, 1 (1918), pp. 115—142 
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2. The economicity of the interpolation process (1. 13) shows itself also 
in other respects. In 7 we shall see how they give at once a proof of the 
Classical inequality 


(2. 1) |P,.(x)| = 1 
for —1=x=+1. More interesting is the comparison of the sequence 

= 1 = 

Ral f= f(1) ~~ Pro)? +H(— 1) * P,-2(3)? + 
(2. 2) : 

n- 1 ae f Py-2(x) ne n 
5, SS | i 
+ 21) # | Ro@ark | Ll eree 


with that of the step-parabolae of FEJER 


(2. 3) Fy-2(%,f)= Sf (5) oo eee 
<< — Si n-2\Sk)\A — Sk 


f(x) should stand for a function continuous for —1S3x=+1. The 
deg F,(x,f) of this interpolation process is obviously n(2n—1)>2(n—1)? 
and, as he proved,? the sequence F,(x,f) converges to f(x) uniformly in 
[—1-+¢, 1—e], but not for —1=x=-+1, since it converges at x= +1 
curiously enough to 


(2.4) = if f(tydt. 


In 6 we shall give the very short proof of the following 


THEOREM II. The sequence of interpolatery polynomials (2.2) converges 
uniformly in [—1, +1] to f(x) whenever f(x) is continuous for —1 =x=+1* 
if n— oo, 

In an Appendix we shall give a very simple explanation of the pheno- 
menon (2.4) of FEJER. 


3. For the trigonometrical interpolation the corresponding stability 
problem was solved by D. Jackson? and L. FEjER® to the effect that the 


3 L. Feyér, Uber Interpolation, Gétt. Nachr , (1916), pp. 1—16. 
4 Actually a much stronger local theorem could have been stated. 
5 A formula of trigonometric interpolation, Rendiconti del Circ. Mat. di Palermo, 37 


(1914), p. 371. 
6 In a lecture of G. Pétya. See Jahresb. der Deutschen Math. Ver., 22 (1913), Mit- 


teilungen und Nachr., p. 206. 


2* 
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most economical trigonometrical interpolatory polynomial is given by 


naer aah sin (" —ke} | " (2k 
ery 3 /(2#8}| 42 | = (law. 


n 


Improving a result of D.QuiLGHiN’ we remark that if O=[O=7, 
0= ®=2-s denote the spherical coordinates of a point P on the unit 
sphere, then with the polynomials 7,(x) from (2.2) and (x) from (3.1) the 
polynomials 


(3. 2) Rin(O, B, F) => > F(Or, D,)F, (cos O) o.(P) 
y=1 p=! 


converge for m—+~, n-—+cc uniformly on the whole sphere to F(P) 
whenever F(P) is continuous on the whole sphere. We shall omit the simple 
proof. 

The 7 shall also contain a remark on Legendre functions of the second 
kind. In a further note we shall return to the stability problem concerning 
infinite intervals. (See also the addendum.) 


4. Next we turn to the proof of Theorem!. Let 1 =k=n and _ integer 

and we apply (1.9) with 

= I, 

ye== 0. foraraale 
further 

yee 468 P= ee, es 
This gives at once that for —1=x=+1 we have 
(4. 1) 0 =n) = 1: 
Taking into account also (1.3) we obtain at once that if x, (/+- 4) lies in the 
inside of [—1, + 1], then r,(x) has at x =x, a zero of multiplicity = 2. Thus if 
all points x, are in the inside of [—1, +1], the degrees of all r,(x)’s are 
= 2n—2, i.e. 

deg R, = n(2n—2) > 2(n—1)°. 
If e.g. x11 and x,>—1, then the degree of r(x) is =2n—2 and the 
degrees of the other fundamental polynomials are at least 1+ 2(na—2) = 
= 2n—3, i.e. 


deg R,, = (2n—2) + (n— 1) (2n—3) > 2 (n—1)? 


‘ Interpolazione di una funzione F(P) continua nei punti P di una superficie sferica, 
Boll. Un. Mat. Ital. (3), 11 (1956), pp. 40—45. 
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again and similarly if x,.<1 and x,——1J. Hence the relation deg R,, = 
= 2(n—1) can only be true if 
(4. 2) 1 =X) > Xa >°°?>Xn-1 > Xn = 1 
and putting 
n—-1 
(4. 3) IT (x1) = o* (x), 
1 x ig x)\2 “ot 1—x2 * 2 
Roe)— 5 (OE | +> = seaceeen| + 
(4. 4) 2 oO (1) k—=2 1—x;, (49) (Xx) (xX — Xx) 
=| w* (x) J 
+n Digi . 
2 \w*(—1) 
But from (4.1) and (1.3) it follows also 
(4. 5) r(Xx) =O for k=2,3,...,n—1. 


Deriving three-times the identity 


(xing) 1s (SO) 
1—x, Low (xx), 
at x= x, we get from (4.5) and (4. 2) 
O=(1—x,) w°"(x,)—2x,.0"(xx) (k= 2,3,...,2—1). 
‘Hence the polynomial 
(1— x?) w*” (x) —2xw" (x) 
of degree n—2 has the same zeros as. w*(x) itself and thus 
(1 — x?) @*” (x) —2xw" (x) + Cw*(x) =0 
with a C independent of x. As well known, then it follows C=(n—1)(n—2) 


and 
w* (x) = P,-2(x). 


Hence the necessity-part of Theorem I is already proved. 


5. Owing to the non-negativity of the fundamental functions r,(x) in 
(1.13) the sufficiency-part will be an easy consequence of the identity 


n 


(5. 1) 2 u(x) = 1. 
But this follows at once from the fact that the polynomial 
—1+ > T(x) 
is of degree <2n—3, vanishes for x=§,..., 5, and for x=:,..., 601 at 


least doubly. Hence the proof of Theorem! is completed. 
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6. Next we turn to the proof of Theorem II. Owing to (5.1) we may 
write 


(6. 1) R(x, f)—F (x) = pa (Ff (&) —f(x)) Fon (x). 

Let for —1S x= +1 be 

(6. 2) \f()| =m 

and for the fixed x-place with an arbitrary small positive ¢ and [x’—x| =d(<1) 
(6. 3) If (x)—F(x’)| Se. ; 


From (6.1), (6.2), (6.3), (5.1) and the non-negativity of the fundamental 
. functions r,,(x) we have 


(6.4) Ro S)—L@)| Se+2M =», Fin (X). 


Taking (1.13) into account we have for —1+d<x<1—d 


n-1 1 
6.5 cee 4 seal ee 
se eis Fon (Xs i eee, #!! es 4 (1—8) Pea) 9’ 


further for 1—_d =x=1 or for pare rie 


n-1 


6. 6) eatte Fyn (Xx) < (1 — x?) re (x)? Bets 2 o aps (1 cl 2(&)° a 
But writing out (5.1) explicitly by the aid of (1.13) we obtain 
1—x? Pest 
si Pr-o(x) + =e aT Ae Be 
oa 0 5, 1—& P n- 2(Ex)” (x— Ey + 
and thus taking the coefficient of the highest power of x we get® 
n-1 1 
= (1—E,) Pao(Exy 
This, (6.4), (6.5) and (6.6) give together 


i 


(6.8) Ral, f)— FS + 28 1 — 2%) Py a 


Taking into account that according to S. BERNSTEIN’s inequality’ 


| Pa-2(x)| = \2 1 


zt V (n—2) (1—x*)" 


8 The same identity was derived by Fejér |.c. from his step-parabola and used in 
his convergence-proof too. 

9 Sur les polynémes orthogonaux relatifs 4 un segment fini, Journ. de Math. (9), ¢ 
(1930) and 10 (1931), pp. 219—286, especially p. 236. 
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for —1=x=-+1, we obtain finally from (6. % 


> 8 M 
[Ri AN—fMOlSe + Se i qa see 
if only 
8 M 
n= 2+— pts ee Q.e.d. 

7. The formula (6.7) deserves a slight attention. It can be written in 
the form — replacing n by _}2 and the numbers &, by the &,,-zeros of 
P,. (x) ee 

A * 1-2 P,. (xy? 
(7. 1) 1—P, (x)? = ere ee 
2 1—&, P* (Een)? (x — Fn) 
which puts into evidence the well-known fact that for —1=x=+1 the 
inequality 


LP, (x) |-<=-1 
and for x= 1 
P(x) = 1 
holds. A similar but perhaps more complicated identity given by G. SZzEG6” 
“ ; 1 a 
2 ES = 
PrP +2 & (IY Ga poe ( dx 


1 2 2y\n 
<7 | (Ion F(l —a x )} dy} 


can serve the same purpose. Another consequence of (7.1) worth-while 
mentioning is the inequality 


(7. 2) PQ] f= Ee Ps Gsn)||x—Ee 


valid for —1 =x =+1 and ee n. 
Secondedly dividing in (7.1) by (1—x?)P,(x)? we get the identity 
l 1 ° 1 1 
(1—x°)P, (x) 1—x" p> (1 —Ekn) Pa Een) (X—Skn) 
This can be used to give a simple representation of the Legendre function 
of the second kind Q,(x). We start from the representation 


(7.3) 


(7.4) Q(x) = P(x) lactic: 


10 Ein Beitrag zur Theorie der Polynome von Laguerre und Jacobi, Math. ‘Zeitschrift, 
1 (1918), pp. 341—356. 


266 E. EGERVARY AND P. TURAN 


It is well known that Q,(x) can be written in the form 


(7.5) Qn(x) =F P,(3) log it drs 


where z,-1(x) stands for a polynomial of degree n—1. Now replacing the 
representation (7.3) into (7.4) we obtain 


1 ° andt o¢ 
Qu(x) = Pal) Ihe verge OS 7 Ree. (=a 
1+x med A ered n(x) 


— Pa (x) Oe 


oa 
bs: (1 =—Em) P, (Exn) —— ee Aah I 
Comparing this with (7.5) we obtained the representation _ 
: 1 P.&) 
JTn-1(X) = SS ie. = 3 . 
a = 2 BE) Pa En)? X— Fru 


k=1 


* 


Added in proof (1 December 1958). In a conversation with G. SZEG6 
he suggested the possibility of a new identity concerning the Bessel function 


Jo Ca us Gl. by a passage to limit from (7.1). One could deduce, 


indeed, in a way elementarily the interesting identity 


IW =A hO DS rayeay 


where 4, runs over the positive zeros of j/,(z). To the general function- 
theoretical background of this formula we. shall return elsewhere. 


Appendix 


As mentioned after (2.4), we shall compare our polynomial R,(x,f) 
with FEJER’s step-parabola in (2.3). Writing shortly 


1 
CB Poe 8 b=, —1) 


we have 


n-1 


Fa) = Sf Gen —2ix+8) (Pa) 
= S/@et—x)+ 8) (22) — pee S peyert 
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n-1 


+3 FG) g—x9 PF 14 p, say S eye] 4 


pws) Vin dX > (x)? 4\g 
+316); Hlgereneeran $7 5* Pua Sf @)es) 
and thus 


ae n-1 n-1 n-1 
Fy-a(x,f)—=(S auf 6) Fila) + S16) Ala)+ (Serf) 7000. 


Hence FEjéR’s (n—2) step-parabola is identical with our R,(x,f) if for 
x= +1 instead of f(+ 1) the value 


> fe 
is prescribed. Since, as well known, 
tim S76) = fro 
and generally 
F [rate r(+0, 


the convergence of FEjER’s step-parabolae is generally not uniform in the 
whole interval [—1, + 1]. 


(Received 30 June 1958) 
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UBER EIN PROBLEM VON K. ZARANKIEWICZ 


Von 
I. REIMAN (Budapest) 
(Vorgelegt von P. TurAn) 


1. K. ZARANKIEWICZ stellte die folgende Frage: Es sei A, eine Matrix 
mit n Zeilen und n Spalten, dessen Elemente nur O-en und l-er sind. Min- 
destens wieviel l-er muf A, enthalten, damit darin gewiB ein aus lauter 
l-ern bestehender Minor zweiter Ordnung M, vorhanden sei [1]. 

Wir bezeichnen mit &,(n) die kleinste Zahl der 1-er, bei welcher A, 
schon gewif wenigstens einen Minor M, enthalt. S. HARTMAN, J. MYCIELSKI 
und C. RYLL-NARDZEWSKI [2] haben 


c,n*® < k(n) < c,n*? 
bewiesen, wo c, und c, Konstanten sind. T. KOvARI, VERA T. SOs und 
P. TuRAN [3] haben 
(1. 1) k(n) << 14+2n-+ [n??] 
und 


bewiesen. 

Es sei A,,,, eine Matrix mit n, Zeilen und n, Spalten, dessen Elemente 
nur O-en und l-er sind, und sei k,(n,, 7.) die kleinste Anzahl der I-er, bei 
welcher A,,», schon einen Minor M, enthalten muB. In [3] ist fiir n,—=p’+p, 
Ny = p* (p prim) 

(1. 2) kK (p+ p, P)=P(p+1)+1 


bewiesen werden. 
Im folgenden beweisen wir unter. Anwendung des in [3] beniitzten 


‘Gedankenganges, daf | 

(1. 3) k,(n,, 3) = $(n,+ \ni-+4n,n,(1,—1)) +1 

ist, was bei h—=n,—=n in die Ungleichung . 

(1.4) fe(n) = (n-+nV4n—3) +1 

tibergeht. Dies ist etwas genauer als (1.1). Mit Hilfe geometrischer Uber- 
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legungen geben wir schlieBlich unendlich viele solche Wertepaare (n,, Mo) bzw. 
Werte n an, bei welchen in (1.3) bzw. in (1.4) Gleichheit zutrifft. 


2. Zum Beweise von (1.3) fiihren wir 


(2. 1) s= 4 (n+ V+ 4nn,(4—1) 
ein, das die Gleichung 
(2. 2) (s—n,)s = n,n,(ng— 1) 


erfiillt. Wir bezeichnen durch /, die Anzahl der 1-er in der v-ten Zeile von 
An,n, und nehmen an, daf fiir die Anzahl der I-er in A,,,, die Ungleichung 


(2. 3) Sos 


gilt. Wir beweisen, daf unter dieser Voraussetzung ein Minor M, aus Ay,,,, 


auswahlbar ist. 
Es seien m,,m,,..., 1m, die Indizes der die l-er der v-ten Zeile ent- 


haltenden Spalten. Aus diesen kénnen (3 Zahlenpaare ausgewdhit werden. 
Die Giiltigkeit der Ungleichung 


a0 s(4)-(3) 


v=1 


ist eine hinreichende Bedingung dafiir, daB A,,,, einen Minor M, enthalt. Ftir 
die nichtnegativen /, besteht die Ungleichung 


und folglich ist 


n ny : wt 1 ” 2 1 ny 
23 )-2 58-2 2 4= an (S4) ads 
Hieraus ergibt sich wegen (2.3) und (2. 2) 


(JRE eta AF 


v=1 1 


womit wir (1.3) bewiesen haben. 


3. Wir nennen die Matrix A,,,, gesdttigt, wenn aus ihr einerseits kein 
Minor M, auswahlbar ist, andererseits aber dies erméglicht wird, sobald man 
die Anzahl ihrer 1-er mit Eins vermehrt. Es ist offenbar, daB jede Matrix 
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An,n, gesdttigt ist, aus der kein Minor M, auswihlbar ist, und dabei die 
Anzahl ihrer 1-er gleich [s] ist. Ist in einem solchen Falle s ganz, so gilt fiir 
das entsprechende Wertepaar (n,, 1.) in (1.3) das Gleichheitszeichen, d. h. 
es ist 


(3. 1) k,(n,, Ny) = +(n, + Vn + 4n,n(n.—1)) +1. 


Um gesattigte Matrizen zu konstruieren, betrachten wir den r-dimensio- 
nalen endlichen projektiven Raum iiber einem endlichen Korper der Ordnung 


N=p* (p prim). 
Die Punkte dieses Raumes sind die aus Kérperelementen bestehenden r-+ 1- 
tupeln (X,, X2,..., X11) (nicht alle x; gleich 0). Die Punkte x(x,, X.,..., Xr41) 
und y(y1, ¥2,---, Yrii1) Sind dann und nur dann identisch, wenn es ein K6r- 
perelement 4 gibt, fiir welches 

Xie dys (i= 17, 2,...,7T-+ 1) 
gilt. Die Menge der Punkte 


AA, tdy@yt ees tA ats (t<r) 
wird als ¢-dimensionaler Unterraum bezeichnet, wo &£,, 4.,..., 4:41 K6rper- 
elemente und aj, a,..., Ai linear unabhangige Punkte des Raumes sind. 


Die eindimensionalen Unterréume heiBen Geraden. Eine beliebige Gerade des 
r-dimensionalen Raumes befindet sich entweder ganzlich in einem bestimmten 
r—1-dimensionalen Unterraum, oder hat mit ihm genau einen Punkt gemein. 
Zu zwei Punkten gehért eine und nur eine Gerade und zwei Geraden k6n- 
nen héchstens einen gemeinsamen Punkt besitzen. 

Jede Gerade hat N+ 1 Punkte. Ein ¢-dimensionaler Unterraum kann 
gewonnen werden, indem man jeden Punkt eines t—1-dimensionalen Unter- 
raumes mit einem nicht zugehérigen Punkt verbindet; die Gesamtheit der 
Punkte der Verbindungsgeraden bildet einen ¢-dimensionalen Unterraum. So 
kann man, z. B. durch vollstandige Induktion, eirisehen, daB die Punkteanzahl 


des ¢-dimensionalen Unterraumes 


Nttt—] 
N—1 ’ 
und die Punkteanzahl n, des r-dimensionalen projektiven Raumes 
Nv —1 
(3. 2) a= 


ist. Es sei nun n, die Geradenanzahl des r-dimensionalen Raumes. Mit Rtick- 
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sicht darauf, dab jede Gerade N-+1 Punkte hat, gilt 
(m);( N+1 a (N’—1) 
=| oJ" et 2) a) in GNG==D Ge) ae 
Wir konstruieren nun die Inzidenzmatrix /,,,, der Geraden und Punkte 
des Raumes. Die Zeilen von /,,,, entsprechen den Geraden und die Spalten 
den Punkten. Ein Element der Martix ist genau dann gleich 1, wenn die 
seiner Zeile entsprechende Gerade den seiner Spalte entsprechenden Punkt 
enthalt. Die so gewonnene Matrix ist gesattigt, d.-h. es kann aus ihr kein 
Minor M, ausgewahlt werden, da dies bedeuten wiirde, daf zwei Geraden 
zwei verschiedene gemeinsame Punkte haben. Ferner ist die Anzahl der in 
I,,,, befindlichen 1l-er m(N-+1), da in jeder Zeile N+-1 1-er sind. Diese 
Anzahl ist genau der unseren in (3.3) und (3.2) angegebenen Werten n,, 
und n, laut (2.1) entsprechende Wert s, wie dies durch Einsetzen leicht 
bestatigt werden kann. Damit haben wir das Bestehen von (3.1) bewiesen. 
Ist r= 2, dann ist 


(oa5) 


(3. 4) N= n= n= N?-+ N+. 1 =—p*sep ee 
In diesem Falle gilt also 
(3. 5) fa(n) = (n+-nV'4n—3) +1. 


Gesattigte Inzidenzmatrizen werden auch durch r-dimensionale endliche 
affine Raume geliefert. Labt man aus dem r-dimensionalen projektiven Raum 
einen r—1-dimensionalen Unterraum weg, so erhalt man einen r-dimensio- 
nalen affinen Raum. Auf Grund obiger Uberlegungen gilt fiir die Geraden- 
anzahl n, bzw. Punkteanzahl n, des r-dimensionalen affinen Raumes 
N”*(N’—1) 

N—1 : 
Die Anzahl der Punkte auf jeder Geraden ist nun gleich N. Die Matrix /,,», 
hat somit n, N 1-er, und das ist wiederum der durch (2. 1) angegebene Wert 
s, was durch Einsetzen der Werte (3.6) bestatigt werden kann. Laut (3. 1) 
gilt dann in diesem Falle 


(3; 7) k,(n,, Ny) = +1, 


Ist N=p,r==2, so ergibt (3.7) ie as Ergebnis (1. 2). 

Endlich sei als Beispiel die Inzidenzmatrix des zweidimensionalen pro- 
jektiven Raumes, d.h. der projektiven Ebene mit 5 Punkten auf jeder Gera- 
den, also der Spezialfall N= 2’,r—2,n=21 angegeben. Die gestrichelt 
abgegrenzte Teilmatrix ist die Inzidenzmatrix der affinen Ebene mit 4 Punk- 
ten auf jeder Geraden. 


(3. 6) n= n,== N’. 


tee 1) 
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(Eingegangen am 6. Marz 1958.) 


Literaturverzeichnis 


[1] K. Zarankiewicz, Probléme 101, Coll. Math., 2 (1951), S. 301. 

[2] S. Hartman, J. Myciztsxr et C. Ryii-Narpzewski, Systémes spéciaux de points a coor- 
données entiéres, Coll. Math., 3 (1954), S. 84—85. (Bericht tiber die Tagung 
der Poln. Math. Gesellschaft in Wroclaw am 20. September 1951.) 

[3] T. KévAr1, Vera T. Sos and P. Turdn, On a problem of K. Zarankiewicz, Coll. Math., 3 
(1954), S. 50—57. 


“se Suptwrmen Y 
gals dard, doh rig a Ab) gi a 
meter ona iN s rae 
CF 3} ¢ 
oo. | aes r ir we 
wy & nde toler whist tea gfaeanrgpite fan neem 


wade gSie capes ob Mpruty Nye } 
“I Kd ee poaenere: Mabie i. geruigh i 
Mie M, -dusorwAhl wens, hh aes aie ed 
twel vebbeoPin ce eo ctetdigdks Dilabie feted 
ok et! iN we Ey : 


mays 
$e, by A, oh - ~etiow Wer ig se ae . - on fe 
Bai osed Titik fps. aie 


‘ tenting? 
Heyy ‘4% , gegen Be Tr | AsgErp in 


gids ay, img 2. 1h copwpcecieneile Baal, het | meta 
tity viene Wires ier, 9 mer. wir i, mer 1) hae 
; * tel ta i td ‘a 8 bs os 7 Lt 


i 4) if Y ayoned Fcth . ae 
d o Civen rae gai eer! ' i ‘ 
og a i 7. fs, 5 f 
‘ ae bal it vve nig WA + @i ae er 
4. Saale APRN AR, rene MIS) 5 thi 
pti Kher us cey, Ot ean aan Sen >a neley 
gigi WP ide danse ‘Untenaums 
WeRS Pr aor. Aud 
geet ye fen Piuakien 


80 er me Remi 


« 


, 206 2 296. we 
2 sar en ee ean oe a 
t Aeab Me im " 7 A wth 


tee O—™N Tanceteeh Got 


Wisk (1.6) 4 


= eb Srwte dea fails 
; “(tN il 
. tle. naa CR 


reo 2. weegreihf (2. Ty ethen ie Rigen {He dps 
Sa Sie. ake “what ete aw ‘ockienametin des 7 

PRiiven oo pr ) Og powlektves Ebene eas Fodlicige all wae 

MR, OO OO Ne, cep Pie DP peel we OE My: 

whyemierngs. tir: « Ve gip tustdengirabad ee inon Phone ant 4 

fea oul Pier Cosieten a a seat 


SUR LES SOMMES DE PUISSANCES 
DES NOMBRES COMPLEXES 
Par 


S. UCHIYAMA (Sapporo, Japon) 
(Présenté par P. Turn) 


1. Etant donné un nombre naturel n, nous désignerons par M,, la 
quantité 


bd vw jue 
; Zi +294 +++4+2, 
min |Z1 +22 + ae 
(y #2, -.+5%,) 1SvSn (max |2;|) 
: IsSj=n 
ol le minimum est évalué sur tous ensembles (z,, 22,...,2n) de n nombres 
complexes. M. P. TURAN’ a démontré qu’on a 


Fala 
pour tout n= 1. Cette inégalité peut s’améliorer considérablement, quand n 
est un nombre assez grand. En effet, M. N.G. DE BRUIJN’ a établi qu’il existe 
une constante numérique C >0 telle que 
log log n 

(1) M, > Cogn = 
pour tout a assez grand. 

L’objet de la présente note est de donner une démonstration de |’in- 
égalité (1), en montrant qu’on peut prendre 1—e pour la constante C, quel 
que soit le nombre positif ¢: on note que la démonstration originale’ de (1) 


n’a pas affirmé la possibilité de prendre C supérieure a ah Par exemple, ona 


2 
“1 
n n 1 
a5 
1 


3 
pour tout n= 1, ce qui est meilleure pour n= 9 que l’inégalité de M. TURAN 
mentionnée ci-dessus. 


1 P. Turdn, Eine neue Methode in der Analysis und deren Anwendungen (Budapest, 


1953). 
; 2 P. Turdn, Eine neue Methode in der Analysis und deren Anwendungen, édition 


chinoise (Peking, 1956). 


3 Acta Mathematica IX/3—4 
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Ce m’est un vif plaisir de pouvoir présenter ici l’expression de ma 
profonde reconnaissance 4 M. P. TuRAN pour tout l’intérét qu’il m’a_porté 
avec la plus aimable bienveillance et pour ses remarques trés précieuses. Ma 
gratitude s’adresse également 4 M. N. G. DE BRUIJN qui m’a montré comp- 
laisamment son témoignage pour (1). 


2. Soit donné un ensemble (z,, 2:,...,2,) de ma nombres complexes 


quelconques, tel que 
1 =z, =(|2,| =---=|z,|. 


Posons s,=21-+22+---+2z;. Pour démontrer notre inégalité (1) ou (2) il 
suffit évidemment de montrer que 


(3) me(m >) >I 

1 
pour les (z,, 2,...,2n) envisagés o1 M= max|s,| et e(x) =e’. En effet, (1) 
est une conséquence immédiate de (3): quant a (2) on notera seulement 


que logx => pour x= 1. 


Nous posons f(z) = Uy (1—2z;z): évidemment f(1)—0. En suivant la 
méthode de M. DE BRUIJN, on considére |’expression 


(—Serl—se — (zi<0) 


On a alors 
e[— 3 2] => afs,..-8)2=S@) + D a(S... 592 
v=l1 J jant+1 


ce qui est toujours valable sans restriction 4 z: donc, en y posant z—1 et 
en prenant le module, on obtient d’une part 


Paar .» Sx)| = =e(— m> 4) 


D’autre part, la fonction a;(f,,...,t,) est pour chaque j un polynéme 
en t,.-.,tn dont les coefficients, étant universels, deviendraient non négatifs, 


si l’on remplagait #,,...,¢, par —t,,...,—t,. On a donc 
ey ens ors Bal ae > |aj(s,..-, Sa) S D5 a;(—M,..., —M)= 
j=n+1 j=n+1 j=n+1 
=u zs}{"7") 
puisque 


al—M,.. »—M)— 3 (Ma) (Mra) 
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Or, on peut supposer sans rien perdre de la généralité que M<1: on 
a ainsi 


bat Shes sitol8I 


v=1 


Ii en résulte que 


> a;(Si, saey Sn) 
j=n+1 


aes a} 


et par suite 


d’ou 


fas 


ce qui achéve notre démonstration de (3), car —— 


3. Nous voulons mentionner finalement une pasar du résultat (2) 
4 la solution approximative des équations algébriques de BERNOULLI et 
GRAEFFE: le passage sera complétement analogue a celui. de °. 

Considérons maintenant |’équation algébrique 


So(X) = Ao + AX + +++ + Ang x" = 0 (Quy = 1), 


oli on peut supposer sans rien perdre de la généralité que ses racines 
X),X2,..-,X, Soient telles que 


| Xq| SS | Xq| +> S| Xn. 
La suite des polynémes f,(x) (x= 1,2,...)f étant définie par la formule 
lx) =(—1)" faa (Vx) fu-1 (— V), 


Fi (X) = Aon + A1xX + ere + An, XxX" (Aes. = 1). 
Comme on sait bien, en vertu des formules récurrentes de NEWTON, la somme 
Sy, des viémes nuissances des racines du polynéme f(x) peut s’écrire sous 
forme d’un polynéme en ses coefficients dox, Qix,..., Qnx- 


nous posons 


3 P. Turdn, Remark on the preceding paper of J. W. S. Cassels. (Application to 
approximative solution of algebraic equations), Acta Math. Acad. Sci. Hung., 7 (1956), pp. 
291—294. 


3 
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M. TurAN® a établi, d’aprés un résultat da a M. J. W. S. Cassets,' la 
régle 


(4) plies Bi taal 


n i oe. _- 
(_max |s).|”)P" 
1Sy2n-1 


De méme, en utilisant le résultat (2), on trouve 


9) (atc atl ya | 


a 


( max |s,.|”)? * log > 2 
— \ ace, 

dont la borne supérieure est plus faible que celle de (4): mais concernant 
1 } 


le calcul pratique avec les |s,.|” y impliquées, il peut arriver que la régle 
(5) soit encore plus convenable que (4). Cette remarque est due 4 M. TURAN. 
i 


(Regu le 31 mars 1958.) 


4 J. W. S. Cassets, On the sums of powers of complex numbers, Acta Math. A 
; ; . Acad, 
Sci. Hung., 7 (1956), pp. 283—289, a 


TWO NEW METHODS FOR THE APPROXIMATE 
CALCULATION OF MULTIPLE INTEGRALS 


By 
L. C. HSU and L. W. LIN (Changchun, China) 
(Presented by P. Turdn) 


This work is concerned with the approximate calculation of multiple 
integrals. We shall present two general methods, of which the first one is 
devised only for the approximate integration of periodic functions. 


§ 1. The first method 


Very recently, N. M. Korospov [1] has offered a number-theoretical 
method for the approximate integration of periodic functions. His results are 
surely of practical value. In fact, the labour of calculation involved’ in his 
approximate formulae, can be conveniently carried out by means of the high- 
speed computing machine, though the convergence of his approximation 
process appears to be quite slow. 

In this section we shall proceed to give a new method which is actually 
suggested by the idea of WeEyt’s lemma [2] in the theory of almost periodic 
functions. For obtaining our principal result, we need to make use of 
CHENG—CHEN’s generalization [3] of ZYGMUND’s theorem [4] for the trigono- 
metrical approximation of periodic functions. Our method will yield a kind 
of approximate formulae whose constructions are as equally simple as those 
of Koropov’s. On the other hand, the degree of approximation given by our 
process appears to be much better than that of KOROBOV’s. 

Let f(P)=f(x,...,Xm) be a function of period 2:1 in each variable x;. 
It is always assumed that f(P) has continuous partial derivatives of the orders 
up top (p24). 

} Denote by fa,...¢,(%:,---,Xm) the partial derivative of f in which q@; just 

indicates the number of times of differentiation with respect to x; (j/=1,..., m). 
Thus the partial derivative with order p. just means that @,+---+¢@n,—p 
(a;20). Define 


@,(@) == max [Fess ore tt, (Xa teey Xm) aa Jox: tg (X12 RE) Xm)| 


where the “max” is taken over all the compositions (@,,...,@m) subject to 
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the condition a+ -::+a@n—p (a;=0), and over all the points (x,,..., Xm) 


and (xj,...,Xm) with the restriction > (%j— xP So. 
J 
Let f(PY have the Fourier series of the form 
(1) F(P)~ Cn, vip ha 2 ah eat hah 


where the summation S ranges over all —o<nj<oo (j=1,...,m). Define 
Ap (P) sme 5) Cale aa 


the summation being extended over all (7,,...,m) subject to the condition 
indicated. It is known that the following trigonometrical polynomial (with 
large R) gives actually a very good approximation to f(P) (see [3]): 


(2) SP(P;f) == ms ( —_— bad A,(P) = Payal nog (RYO UE hm em) 
v< Re ve Rt 


where R,k,o, are positive integers with k>p+1, on =|] +1, and 


yri2 \"m 
(3) Ory. ostg(R) = (1— = Cnedins Sed 


Moreover, let us denote 


(4) o*(R) a |ny,..., mm (R)|, 


the summation 3’ being omitted the term of the case » —0, (i. e. all n2;=0). 


Having stated all the preliminaries as above, we may now prove the 
following 


THEOREM 1. Let q be a positive integer and let p(th=f(yit,..., Ymt), 
yj= RT’ ((=1,...,m) and M=R”*”". Then for R large we have 


M 


ip aimee 
Mae) J foto ets w(bdt| = 
0 1) 3 


=20(e(j) +0((p) (3) 
es R RE AVR 
Proor. It is clear that the inequality »—n}+---+n3,<R® implies 
\n;| =R—1 (j=1,...,m). Consider now all the linear combinations a NY; 
of yj; = R*’; we may easily find that 
(6) ink fyb + + tn in| = RO 


where the “inf” (infimum) is taken over all (7,,...,m) subject to the con- 
dition ni+---+nn<R* with (m,,..., Am) (0, ..., 0). 


(5) 
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According to a generalization of ZYGMUND’s theorem due to CHENG and 
CHEN (see [3]), we know that 


p 
9 stin-ne»-ol(5 
(7) PP N—MP)= Ol |B] oz 
holds uniformly on the domain D(Q=x;=22; j=1,...,m). Therefore, on 
substituting g(t) =f(it,..., mt) into (7) and by bermewiee integration, we 


may obtain ee view of (2)) 


on ae R 
(8) = 1 tal ) (eo Tt pte ME Yh) de 


+ a,...,0(0R) + O @e (z)) 


where 


Hence, by making-use of (6) and (8), we have 


joel es olf) 


MR! m R 


where the constant factor involved in the order estimation O(-) depends 
merely upon the function f(P). This is what we wish to prove; as we have 
ulready assumed M=R?*”‘. 

Obviously, the factor o*(R) contained in the right-hand side of (5) can 
ye replaced by the absolute constant 


9) a= > |Cy, ree els 


n case the Fourier series (1) is absolutely convergent. 

As is easily seen, the meaning of Theorem 1 lies in the fact that the 
n-fold integration of f(P) over the domain D(Q=x;=2z7) may be replaced 
proximately by a definite integral. This remark suggests that Theorem 1 
an be employed to construct a variety of approximate formulae for the 


nultiple integral concerned, since in fact the definite integral Jeqat may 
0 


e evaluated by various approximation methods (quadrature formulae). 


— 


| 
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In order to illustrate the method just indicated, we now take, for instance 

g==p-+m—1 in Theorem 1, so that M=R, and we apply the Simpsor 
M 

formula with N-+1 terms to the integral (1/M) J (tat, where N= M’ is 


a large even integer, r being a certain positive integer to be chosen for bes! 
advantage. Clearly, we may express 


(10) i) 90359 Wey An, 22) LYm) + Ew, 


where n= (M (k=1,...,m) and 


1 for %=0, N; 
Ai=j2 for J/=even integer <N; 
4 for /—odd integer, 


(11) 
and the remainder is estimated it 


(12) kewl = yah (Mi N-sup io) 


By the definition of w(t) we may find that 


d‘ 
|p (t)| = gps its +++ Ymt) = 
S af AH op | 

< . Pano Skate I} fe 

srt = eh thd OX:OXj;OXKIN = (MV Yy mK 
where 

otf 

13 = plea a fain 
i) sf stg OX:OX;AXKAX |’ 


the supremum being taken over all 1<i, j,k, /=m and O=X;, Xj, Xe, S20 
Thus, by recalling that N—M’ = R’, we obtain 


(14) lew] sR Ri EK pacoemrn, | 


On the other hand, we have seen that the order estimate of the right-hand 
side of (5) is of O(R’”). Hence it is better to choose r such that 4(p-+m— 


—r—1)=—p. That is, we may take r= 41 G6p+4m—4), so that we have 


(14 bis) ale alls 
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pol. 
Moreover, we may express i= Rk ie (k—=1,...,m). Hence, as a con- 
clusion, we may state the following (with M—R=L"‘): 


THEOREM 2. Let L denote a positive even integer, and let N= L™**™*, 
Y= LY” (k=1,...,m). Then for N large we have 


= 


22 On 
rs romper 
(4) if ; {fPydx: *dXn— 3% yd Aif(Ly,, -- +; Lm) 
0 0 


= [iso $2°\(z) +z (c7) 


where o(L)=o'(L')=o and A, and K are defined by (11) and (13). 


(15) 


As a comparison with KOROBOv’s results, we may observe that the 
degree of approximation by Theorem 2 is much higher than that of KOROBOV’s, 
especially for large p. In fact, the principal error estimation contained in 
Koropov’s theorems (pp. 1062—1065 of [1]) is O((1/N)"); while in our 
case the error is of the same order as (1/L) —(1/N)”?*”® where 
4p/(5p+4m—4)~=4/5 for p large and 4p/(5p+4m—4)>4/7 for p=2m. 


§ 2. The second method 


The object of this section is to present a quite effective method for the 
approximate integration of functions having no periodicity in its variables. 
The original idea of the method has been generally given in a previous 
paper [5] due to one of the authors, but not fully developed. In the present 
work we shall always assume integrand functions to possess continuous 
partial derivatives of higher orders, so that results much more precise and 
useful than the original ones may be obtained. 

We shall confine our attention mainly to the case of double integrals, 
for there is no essential difficulty involved in the extension of our results 
to the case of many variables. 

- In what follows <a> always denotes the fractional part of «, i. e. 
<a>= a—[a]. For convenience, we also use the notation (p(x). = y(6)— (a). 

Applying the Euler—Maclaurin summation formula and making use of 
a well-known property of the Bernoulli polynomials, we can now establish 
a pair of “expansion theorems” as follows’: 


THEOREM 3. Let F(x, y) be continuous together with its partial derivatives, 
with respect to x, of orders up to m(21) on the square region R(O=x=l, 


284 L.C. HSU AND L, W. LIN 


O=<y<1). Then for N (integral parameter) large we have 


1 


ae y)dxdy — | Fs, <Nx>)dx — 


0 


pe ‘(ee J. Boty)dy-+OW™) 


(16) 


where B,(y) is the Bernoulli polynomial of degree v. 


THEOREM 4. Let the continuous function f(r, 6) be of period 22 in 6 
having continuous partial derivatives, with respect to r, of orders up to m on 
the circular region SOSr=1,0S052z). Then for N large we have 


Ja 6)dS = 2a 22Nr)rdr— 
(17) 
er nay a) fr. (0). Be | 40+ O(N” ") 


v=1V 
where F,(0) = Ahearn pry AEN 6), f(r, 0) de- 
noting the vth partial derivative of f(r, 6) with respect to r. 
Proor. Denote 4x =1/N and let (cf. §1 of [5}) 


kd 


w= > f (Fee <nay—r (4G, <nap)) as, 


(k-1) 4x. 
w= Sf an(|(e(t=t 9) rer}. 
(k-1) 4 0 


Evidently we have 
kAx 


Felt cwo)ocm fanfe( tt aor 
(k-1) 4x (k-1)42 0 
sO we may easily verify that 


(18) FCs, <Nx>ydx =| [Fe pdx dy +l) + Ya). 


Applying TAyLor’s theorem to expand F(x, <Nx>)—F aes ; <Nx)| in terms 
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of the powers of (x— EH, and then using term-wise integration, we may 
express w,(N) in the form 


19) w= mm) Swi 7 (AS y| ray} 400. 


ae 


1 


(x)= | 2, F(x, yrdy (lsv=m—1). 
0 
Then the Euler—Maclaurin summation formula with a remainder estimate is 


Let us define 


seen to be applicable to the sum >. o| Lee N’ yielding 


Bs 


nO) = zal let ro 8I0 


x”-1 


ort 


dats z=1 i ea zl ee) 


where ee are known as vi Bernoulli numbers. Now collecting 
all the terms of the same power in N, we find that the coefficient of N~ is 
given by (with B,—1) 


= [(E5 S arr) 


Making use of the formula B,(y) = 3 ( "| Byy""* for the Bernoulli polynomial, 
=~ t] 
we can still simplify the ccoreasicn of the coefficient. In fact, we have 


cad {el |_,@-0)—B)ay, 


Thus we get the result 


@ wM=-S—, Ae (B.(y)—B,)dy + O(N”). 


As regards the summation y.(N), we may directly apply the Euler— 
Maclaurin formula inasmuch as w,(N) may be rewritten in the form — 
1 


¥2(N) = >. G (4H a ln it —| Geax 
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ee em TN 


1 
where G(x) =| F(x, y)dy. Noticing that 
; ja zl } 
G°-(1)—G"- (0) ~{( A)» (lsv=m-—}), 
0 


we obtain finally H 


: ot | 


wD 0 3 star (Garang? FOC 


0 
Hence our Theorem 3 is proved by means of (18), (20) and (21). . 
For proving Theorem 4, it needs only to transform the polar coordinate — 
system into the rectangular one, and make use of Theorem 3. Since the 
deduction from Theorem 3 to Theorem 4 consists of only elementary calcu-— 
lations, we may omit its details here. 


; 
In particular, taking m= 2 and recalling B,(y)= —a Wwe see that 
the formula (17) gives of 
[J#@, @¢S—2a| fr, 2aNNrdr = 
s 0 


rm dt fn 6) ( ae a d0+O(N*). 
0 


This is clearly a refinement (or an improvement) of the MARECHAL— WILKINS 
theorem (see [6]; cf. GROSSWALD [7]) and also of a result obtained previously 
by one of the authors (see § 1 of [5]). As a consequence, we may immediately 

1 


infer from (22) that the integral 27r | f(r, 22 Nr)rdr can approximate {Ire A)dS 
6 Ss 


with an error estimation of the order O(N~°) in case f(r, 0) vanishes along 
the circle r—1 (the boundary of S). . . 

As is easily observed, the formulae (16) and (17) are useful for the 
approximate evaluation of the double integrals 


se | 
JJ FG ndxay, |) Ar, as. 
0 Ss 
In fact, taking for instance N10, m4, we see that the right-hand side 
of (17), which consists of only 4 definite integrals, will provide quite a good 
approximation to | f(r, 9)dS in case |F,(6)| is moderate in its magnitude 


Ss 


Ae ] 1 1 ] 
[noticing aso |8.())= 5, [BON = 4 BO = py BON =p for O-<y=1), 
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On the other hand, if FAs y) is of period 1 in y, then F(x,<Nx>)= 
= F(x, Nx) and the integral JF (x, Nx)dx with large parameter N can also 
4 evaluated approximately through the computation of the double integral 
[Jr y)dx dy with an error estimate rendered by the formula (16). 


It is clear that F(x,<Nx>) is in general not a continuous function of x 
inless F(x,0)=F(x,1). But this disadvantage can easily be obviated by 
eplacing F(x, y) by 


23) P(x, ) => (F(x, DFID} 


for actually we have F(x,0)== F(x, 1) and if F(x, y)dx dy = if F(x, y)dx dy. 


Moreover, recalling the simple relation Badeeay’ B, (y) for the 
Bernoulli polynomials, we may accordingly deduce that 


: a | 


f (2-Fe.n) -Baoray= Com f(r 19] Badray 


Thus upon substituting (23) into (16) we get at once the following 


THEOREM 5. Let F(x, y) be continuous together with its partial derivatives, 
with respect to x, of orders up to 2p+1. Then we have the expansion of 
the form 


1 


{fre y)dxdy =| Fe <Nx>)dx — 


0 


-Sabalt) [esl wore 


(24) 


where R,—=R,(N)=O(N””) for N large. 


This expansion formula is certainly better than that of Theorem 3, 
inasmuch as F(x, <Nx>) is already made continuous and the speed of con- 
yergence has been improved. Moreover, it is seen that the formula may be 
ised effectively for the construction of cybature formulae. As a matter of fact, 
when specializing N and p (e.g. 5SN=10, 3Sp=6), the right-hand side 
of (24) gives only a few definite integrals, to which the Gauss quadrature 
ormulae may directly apply. Concrete examples will be omitted here. However, 
it is worthy of mention that the cubature formulae so constructed are actually 
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of higher accuracy which may be comparable with LIUSTERNICK’s work [8] 
on the cubature over a circular region. 

A question of some theoretical interest may arise: When does the 
remainder R,—R,(N) tend to zero as p-+co? Evidently, the following 
theorem just gives a sufficient condition for R,(N)—0 (p—-~): 


THEOREM 6. Jf the continuous function F(x, y) possesses partial deri- 
vatives of all orders with respect to x, and if 


) eels 1p C 1, 2,3 
= = er F 
te, naent PE aig Perey pens (r Lert 2 
then we have the following estimate for |R,|: 
bad ern 
mize) Ris6(1+35) > aap 


Proor. It is known that |Bo,(y)—Bs,| attains its maximum at y= ye 


Moreover, by the multiplication theorem of Bernoulli polynomials we have 
B,(4|=@'"—nB,. Thus, for O=y=1 we get 


| Bo (y)| = Bo, (4) — Bs, + | Bo, are |(2'-” —2) Bz,| + | Bo, | = 
¥ he, nl - (2r)! 1 a 
<= 3|Bs,|=6 Qa) Le <6 Gar (ins (r=1) 


Here we have employed the series form of the number |Bo,|. Consequentl 
we obtain 


eS TSIRN Gilde oe fe | pee 
els 2 (2r)! fa mmax|Bs-()|-C,=6(1 +5545] 2 (22N)*° 


r=ptl r=pt+l 

Hence the inequality (26) is proved. 

COROLLARY. /f the series & C,/(20N)* converges, then R, +0 (p—+co 
and the right-hand side of (24) can be extended as an infinite series. 

Let us finally mention a result for the case of 4-fold integrations. In ; 
manner. similar to the case of two variables, we define 

= 1 

F(x, y, U, vr) = {F(x y, u,v) + F(x, y, 1—u, v) + F(x, y, u, L—r) + 

+ F(x, y, l—u, 1—v)}. 


It is then Eni verified that F(x, y, <Nx>, <Ny>) is a continuous functioi 
of (x, y), provided that F(x, y, u, v) is a continuous function of the 4 variables 
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Thus, by applying a generalized form of the Euler—Maclaurin summation 
formula for several variables, we can establish the following 
THEOREM 7. Let the continuous function F(x, y,u,v) have continuous 
partial derivatives, with respect to x and y, of orders up to 2p. Then we have 
the expansion formula 
AG ie Lae | 


|||) Faxdy du dv— [fe y, <Nx>, <Ny>)dx dy — 


0000 


-£4(f)fformoee+o(H)") 
where 


y Vas) 3 : ) Btu) B ea 


6x? Lg yr et Lage 


(27) 


the summations >>)* and meld being taken over even integers r (2=r=2p) 
tion F is differentiated r—\-times with respect to y and then integrated with 
regard to x from O to 1. 


r=1 
and s (O=s=rnr), and the notation ( signifying that the func- 
z—0 


The proof of this theorem runs quite similarly as that of Theorem 3 
and need not be reproduced here. 

Evidently, the formula (27) can be employed for constructing approxi- 
mate formulae for the 4-fold integrals, as N and p are suitably chosen fixed. 
Finally, we see also that Theorem 7 actually suggests a further generalization 
to the case of more variables. 
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AN EFFICIENT PROCESS OF SUCCESSIVE APPROXIMATION 
FOR SOLVING ALGEBRAIC OR TRANSCENDENTAL 
EQUATIONS 
By 
L. C. HSU (Changchun, China) 

(Presented by P. TurAn) 


§ 1. Introduction 


4 Throughout this paper we shall consider an equation of the ordinary 
orm 


(1) f(x) =0. 
Here f(x) is a single-valued function continuous together with its first and 
second derivatives f’(x), f’(x). In case the function f(x) is of a complex 


variable (x u- iv), it is assumed to be analytic. 
The process mentioned in the title is constructed as follows: 


(2) Xoo Kae = Fic eit eastt 52) 


where x, is an initial approximate solution of (1), and x, is determined by 
the classical Newton method 


(3) %1 = Xo FY 


Obviously, the process (2) differs from both the Newton process and 
the ordinary method of chord for real equations. Certainly, we may also call 
(2) the Ud Newton prod in view of the fact that 


—Xn-1 
ean em 1) ~F em 


As a comparison with the Newton method 


for (X,—Xn-1) > 0. 


(4) a, wee ae (HeBOM bp NRE) 
we may assert that the process (2) is more convenient for practical. appli- 
cations. In fact, the Newton method requires the values x;, (x7), f(x) 
(v=0,1,..., 2) in order to determine the (a+ 1)th approximation xn41; while 
in the process (2) only the values x,, f(x») (v=0,1,...,m) and f’(xo) are 
needed for calculating x,,:. On the other hand, we may also predict that 


4 Acta Mathematica IX/3—4 
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the convergence speed of the process (2) should be much better than that 
of the modified Newton method 

LX) 
Ff’ (x0) 


(5) Xna1 = Xn — (n=0, 1, 2,..-; 407 ae 


§ 2. Convergence theorems 


In this section we shall be concerned with the case in which /(x) is 
a real function of the real variable. By means of certain geometrical consi- 
derations we may prove first the following 


LEMMA. Let / be a closed interval within which the equation (1) has at 
least one solution. Let x, be an interior point of I and let 


(6) F(%)f" (x) > 0 (x € /). 
Then the sequence {Xn} as given by (2) converges monotonically to a solution 


x" of the equation with x* €1. Moreover, the convergence speed is comparable 
with that of {x} of the Newton process (4), viz. 


(7) | X2n-1—X"| < |xn—x"*| (N= 23.5): 


PROOF. It is no real restriction to assume f(x) >0,f’(x)>0 (x€/). 
For otherwise we may consider —/(x) instead of f(x). Clearly, the condition 
f’ (x) >0 just means that the curve y—/f(x) is strictly convex throughout /. 
This fact actually implies that f’(x)=-0. Suppose on the contrary that 
f’ (x) =0. Then f(x) must attain an absolute minimum at x—=x,, and con- 
sequently f(x) = f(x.) >0 for all x€/. This clearly contradicts the pre-suppo- 
sition that f(x) has at least one zero within /. 

Consider now the case f’(x)) <0. Let x* denote a zero of f(x) in J 
which is nearest to x). Then by the convexity of y— (f(x) we see that the 
Newton sequence {xn} (x§=x,) is monotonically increasing to x*. In fact, 
the relation lim xi==x* follows at once by letting noo in (4 bis): 
Ff’ (Xn) (%r41 — Xn) = —F nr). | 

In order to prove (7) and limx,—x* we need to compare the conver- 
gence speed of {x,} with that of {x,}. Evidently, the relation (2) means that 
Xn41 is just the abscissa of the x-axis determined by the intersection of the 
line through the pair of points (%,-1,f(%n-1)) and (Xn, f(X»)). On the other 
hand, the abscissa x;4: is determined by the intersecting line tangent to the 
curve y=f(x) at x—x,. Thus by the convexity of y—/j(x) we easily find 
that Xn <Xnia<x* (for all n) and 


Xo = XO << X1 = XI << Xo < XB < Xz. 


AN EFFICIENT PROCESS OF SUCCESSIVE APPROXIMATION 293 


Consider now, for instance, x} < Xy-1 < x,. Clearly, it must follow that x31 < Xu, 
using the convexity again. In other words, the case x} < Xu-1< Xu < Xui) S XBu1 
can never occur. Hence the worst case regarding the convergence speed of 
{x,} is seen to be 
Be he Xe Soke Xa << Xp ele < Xp << Xe SX So XS S Xa, Sy SG 
Consequently, we obtain lim x, —x* and, moreover, 
| Xoy-1—X"| < |x~—x*| (vrs, 3, 203): 

The other case f’(x,) >0 can be treated in exactly same way. Hence our 
lemma is proved. 

The lemma just proved enables us to state a pair of convergence theo- 
rems with the aid of the well-known results due to A. OsSTROWSKI and 
L. V. KANTOROVITCH, respectively (see §§ 5—6 of [1] and [2]). 


THEOREM 1. Let x, be a point interior to a closed interval I and let 


(8) F (Xo) f" (x) > 0, (Xo) f(a) < 0 (x€/) 
where «@ is an endpoint of I. Then the sequence {x,} constructed by (2) con- 
verges monotonically to a unique solution x* of (1) with x* €1. 


THEOREM 2. Let x, be an initial approximation and denote 


Lest] A: F(X) | __ 
(9) Lee = fy, Ff’ %) a oie 
Let I be an interval of the form 
(10) jx—x,| = Meelis 2s to (0 Caps ¥ 
within which we have ; 
(11) POS gr» Feodf’()>0. 


Then the sequence {x,} of (2) converges to a solution x* of (1) within I. 
Moreover, the speed of convergence is estimated by 

i 1 \n-1 = 
(12) | X2n—x*| < | X2n-1—X"| < (s} (2a.)"""! No. 


As a matter of fact, the uniqueness and the existence of the solution 
of (1) as asserted, respectively, in Theorems 1 and 2 are implied by OSTROWSKI’s 
and KANTOROVITCH’s theorems (see Theorem 4 af § 5 and Theorem 1 of § 6 
of [1]). Other conclusions of our theorems are merely consequences of the 
lemma. For instance, (12) actually follows from (7) and the known estimate 
about |x,—x"|. 

Evidently, our Theorems 1 and 2 do not apply to the case where (x", 0) 
is just the point of inflection of the curve y= /(x). 


4* 
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§ 3. A further theorem on convergence 


More generally, we shall now consider (1) as a complex equation in 
which the unknown x may be complex or real. A result to be presented 
here is somewhat similar to that of I. P. MISOVSKIH for the case of NEWTON’s 
method in solving general functional equations (cf. Theorem 5 of § 6 of [1]; 
see also [3)). 

THEOREM 3. Let the following conditions be fulfilled: 

1° [f’'(x.)'| = 8>0, max (|f(%)|, 4/f0)|) = 1 > 0; 

2° |f’(x)| = 4 holds for all x’s in the region |x—x)| =y; 


sh y=oi(1t2>e"), a=48'ld, yb S a 

Then the equation (1) has a solution x* (|x*—x,|=y), toward which 
the process (2) converges with the convergence speed estimated by 
(13) |Xngui— X*| S yar 
where @<1 and w(n) = 2l""I—1, [n/2] denoting the integral part of n/2. 


Clearly, all the conditions 1°, 2°, 3° of the theorem can always be ful- 
filled when / is sufficiently small (i.e. when the first two approximations x, 
and x, are sufficiently near to x*). 


. PRooF. To begin with, we shall now prove that all the x,’s are con- 
tained in the region G:|x—x,|=y. Since in accordance with (3) we have 
F(X) 
f' (X) 


it is seen that x,€G. Using induction, suppose that x,,x,,...,x,€G. We 
shall show that x,.1€G. Clearly we have, using conditions 1°, 2° and 3°, 


|X; —Xo| = pix ¥, 


f(%n)—fXn-1) 


Xe Xn-1 


= free tO — xa = 


= If «|| J Gitte, —x)—F Cedlat| = 


1 
= p13 | [Xn t+ t(X,—Xn-1)—X|dt = 
0 


1—fyd _ 1—3/4 1 
ae Pe Ys 


= f'!—dy= 
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Hence it follows that 

Xn —Xn-1 = ; ae 
ete \f(x»)| S 48 f(x,)| = 
— 48] fe) se) — [Aa fend(s, —4.)] 


48 |\f(%0)—f 060-1) —F' x1) he —0-)| + 


pes )—S(Xn- ») (axe) < 


+\(r So) I mance 
= 4s\5 B|Xn—Xna + Xn—Xn-1 i fred Pons tte ana | = 


|Xn41— —Xn |= 


1 
1 ‘ ' 
= 48] 4 b|x4— x01 + |Xn—Xn-1|d | I —x-2) (19 | dt = 
0 
1 
= 480 2 |Xn—Xn-1 +> |Xn—Xn-1| [x41 — Xa _ 
480|Xn—Xn-1|? for 
'y ' 48d|Xn-1—Xn-2)? for 
So we have arrived at a recurrence relation for |x,4:—x,|; and consequently 


|Xn—Xn-1| = |Xn-1—Xn-2|, 


|Xn-1—Xn-2| = |Xn—Xn-r|+ 


we get 
|Xn+1—Xn| S (48d)'?+--- 42°" (max(|x2—2,|,, |X —X0])) 


where s = [as]. Notice that 


max (|x, —Xo|, |\xx—x|) = max 3 TCR TER 70s) x) 
= max (81, 48|f(x,)|) = 8. 


= 


Moreover, we have «== 47/0 <1. Hence for any s= [el we have 


|Xnt1 —Xn| S (48d)?"1(8l)” = Bla”! = Blave-, 


Consequently, we obtain 
|Xn+1— Xo] = > |Xxnt —Xx| S thi + > awed 
k=O { k=1 


< BI}¥4-2 > a?” 
v=0 


so that x,.: is contained in G, and the induction is complete 


a 


—= 75 
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Furthermore, we find 


nt+p-1 , _@ 
(14) |Xntp—Xn| S pa) |Xei1 — Xz | < pt} Save = 
k=n =n 
= av(-) y +0 (a— oo). 


Hence {x,} is a fundamental sequence tending to a limit, say x°=limx,. 
Evidently, |x*—x,| = y and moreover f(x*)—0, since in fact 


|Xnv1 —Xn| S 48|f(xXn)| S 48d - max (|Xn—Xn-1|, |Xn-1—Xn-2]). 
Finally, we have by letting p— oo in (14), 
|x*—xn| S yaver-, 


The theorem is therefore proved. 


§ 4. Remarks 


Our first remark, as may easily be justified, is fhat almost all the known 
results concerning the Newton process may be extended to the case of the 
new process here proposed. Actually, the validity of this general remark 
follows precisely from the asymptotic relation between the two processes. 

Also, it may be noticed that the estimations of the convergence speed 
involved in Theorems 2 and 3 are quite rough. In fact, there can be found 
various numerical examples, showing that the real speed of convergence of 
the process (2) is often much better than those given by (12) and (13). 

As a final remark, we point out that the classical CHEBYSHEV’s process 


PPCM lis O65) panto Qt 
(19) at ele ere) a Fey) aay Oh ae 


may be modified in such a form that the third term of the right-hand side 
of (15) is replaced by 


2 FE eee aree: 


It is apparent that the modified process 


(16) Xn+t =x, — Fe —e (n=O, I, 2,...) 


is more convenient in practice than the original one, especially when the 
values f”(x,) are not easily calculated. Certainly, the mode of convergence 
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of (16) should be, in general, much better than that of the Newton process 
and is slightly inferior to that of (15). 


DEPARTMENT OF MATHEMATICS, 
NORTH-EAST PEOPLE’S UNIVERSITY, 
CHANGCHUN, CHINA 


(Received 9 May 1958) 
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AN ESTIMATION IN THE THEORY OF DIOPHANTINE 
APPROXIMATIONS 


By 
E. MAKAI (Budapest) 
(Presented by P. Turdn) 


§ 1 


P. TURAN observed [5] that certain extremal problems connected with 
the sums of the same powers of different complex numbers play an important 
role in numerous problems of the analysis and number theory. One of his 
results is that there exists a constant A such that 


(1) Mw,» = min max |l+z2+-- -+241>lg@a| = == K,,,, (A). 


lz|=1 u=m-+],..., m+n 

Originally he found that (1) is satisfied by A= 24e and later in a paper 
written with VERA T. Sos [4] it is shown that A = 2e'+*” = 24, too, satisfies 
the inequality (1). They remark that the lessening of the constant A plays 
an important role at certain applications and the question was raised to find 
the least numerical constant A* for which M),,.> Km, (A) pice peony of 
m and n. 

Applying an idea of P. ErDOs they showed [4] that A*>1,321 and in 
the same paper they indicated a way which it was expected to lead to a 
better lower estimation of A*. They have shown, namely, that if H,(y) is 
the Hermite polynomial defined by 

vo? da” -¥ 
LNG ed Fee ie a 

and H,,(4)=0, then denoting by D,(?) the least of the moduli of the roots 
@,, 22; -<+,2n Of the equation 
Hy days 


(2) Sn(Z, A) = pee =0 
one has - i 
(2’) + es fe [HeCIl° i 


In the following we will a in a certain sense asymptotically exact 
estimation for the least of the moduli of the roots of the equation s,(z,4y—0 
if H,,(4)<0. This estimation is as follows: 
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If 0=9=1 is a prescribed quantity and 2°., is that of the numbers & 
satisfying Hys(2)=0, Hn(A)<O which is nearest to the quantity —9V 2n + 2, 
then the roots of the least modulus of the sequence of the polynomials 


Sn fz ins} (qe 
converge, as n-»+cc, to the only positive root x of the transcendental equation 
(3) V2exe*t2 V2Gx+9 4 1 
From this we will have that 
A* >1,473. 


Our result has common features with some other investigations, too. 
The polynomial (2) is a partial sum of the power series expansion of 
e-*+2 considered as a function of z. The repartition of the roots of the 
partial sums of the power series of e* was studied by G. SzeG6 [2] who 
investigated the possibility of the extension to entire functions of a theorem 
of JENTZSCH. To this question some contribution is given by the result (3). 
Another equation analogous to (2) is 


> P,(d)z” =0 
v—0 


where P,(A) is the Legendre polynomial of degree » normed by the condition 
P,(1)=1. Its roots were investigated by G. SzeG6 [3]. 


§ 2 


We will need a generalization of a theorem of SONIN by POLYA which 
according to SzEGO [1, p. 161] can be shown as follows: 
Given the differential equation 


(4) (k(x) + 9(x)y=0 
where in a<x<b p= g(x) and k= k(x) are positive and sufficiently smooth 
functions, moreover wy — w(x) —1/(k@) is monotonous. The derivative of the 
function 
‘i fxy=y¥+ hy? wy 
P(X)=2yy + 2kKy? +k 2y' yy Ry ty = kyey = — yi(key 
fp 
1 If H,,(A)>0, the same statement holds, only the calculations are more lengthy. 


Cf. G. Szeaé [2], the basic idea of which is used in the following demonstration. Formulae 
(8) and (9) of this paper are the analogues of formula (1”) of G. Szea6. 
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whence one sees that if km is monotonously decreasing (increasing), then 
f(x) is monotonously increasing (decreasing) in the interval a=x~<b. 
It follows that if the zeros of the function y =y'(x) are xi (asxi< 
<X;<++-=b) and k@ is e. g. monotonously increasing in (a, 6), then 
Fa) =[YODP>[y@aP>--- 
(theorem of SONIN—POLYA) and hence 
(5) f@>([y@P @sx=d). 
If again the zeros of y—vy(x) are x; (a=x,<x,<-:-<6) and kq is 
€. g. monotonously decreasing in (a, 6), then the inequalities 
Fa) Sf) <f(%2) <-- 
are equivalent to the inequalities 
k(x) , k (x2) 4 
6 aj= xOre X)P<-es. 
(6) fa) = Sey WP < Sas Da) 
From (5) and (6) we can derive two lemmas connected with the Hermite 
polynomials. 
LEMMA I. Jf Ay41(24) =0, then 
H,(a) = AnV2n+3—2e”” 


n! 


Proor. It is known that e-*7?H,4:(x) is a solution of the differential 
equation y” + (2n-+3—x*)y=0. Comparing this equation with equation (4) 
it is seen that now k=—1, 9(x)=2n+3—x and kq@ is monotonously de- 
creasing and positive in 0<x<|/2n+3. Now it is known that #°<2n-+ 3, 
so using (6) we have for 42=0 


where 
An, 


IIV 


Ines ieaiae — 
(8) = fe 7/2 As (x)]|z—0 + Ont3 Ei 3 Ee e* io Rape w] = 
ee . 
2 epee | 


whence with the help of the relation: Hi41(x) = 2(a+ 1)H,,.(x) 
Ay 41(0) j 1 2 l 2/2 (A 2 
[SO | HOPS app g ple Ol 


2(n+ 1) 
Denoting the left-hand side by A, and using the formulae 
. m(2m)! 
yee! Han(Q)=(—1)" F2™ , Hamss(0)=0 
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[1, p. 102], one can write 


: 1 ri} 
ye (1) LR IN pr joy ed C4 a) 
2 / 3 2 m! 
m!|/ m+— 
4 
whence 
Agee 1 


Thus we have proved Lemma | for non-negative 4’s. The validity of the lemma 
for negative 2’s follows from |H,(4)|—=|H,(—A4)]|. 


LemMA I]. Jf |x| < /2¥+1 (v>1), then 


entlz 
1H, (x)| = By - 
V2v+1—x* 
where 
By \2041 bal 


Proor. Consider the differential equation 


y’+u(x)y=0 (u = u(x) = 274 1—x’), 
one of whose solutions is e-*?#/,(x), and put y—u-'‘y. Performing the 
calculations we get 


5 1 
-1/2,/) 3 -5/2, 2 
(u wy+(Ru 4x aay 


one solution of which is 
(8) v = '4e-2 FY, (x). 


The last differential equation is ee special case of (4) where 


u-8P 4 w| v=0, 


k(x)=u'?, o(x) == - 52. AX? > 8/2 4 gle, 
It is to be seen that if 0<x< eed then k(x)>0, g(x)>0 and 
kK) 9x) = Pw 9 et wht 


is a monotonously increasing function of x. Using formula (5) we have 


+u-' (3 u-5/2.4 x? + + u-3? 4 uw} “|= [o(x)P «(OS x</2r+)) 
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Writing in the place of v the right-hand side of (8) and in the place 
of u the quantity 2v+ 1—»°, we have for ®<2v+1 


Y2v+1 (4-0) +3 p FTE [HOF =| y2r+ 1—x*e-*2H, (x)|. 
Denoting the left-hand side by B> and using (7) one can write 
page. Vam—-1 (2)! Gn) 


1 
a, (2m+1)! | 2| 1 i 
Bomit = V4m+3 Sr homme 2(2m+1) +144 3 2(2m+1)41 
and from this 


B= Var om (v+1). 


§3 


Let again H,4:(4) 0. Our two lemmas yield upper and lower bounds 
of H,(A), whence using the notation 


rashes 
A,,(4)| (a +1) : 
C,.(d) = 2 we ot DS = 
we have 


ot 


n+1 (n+1)/2+1 4 n+1 (w+1)/2+1 
2 eG + ae <Cr(A)<V2n+1 ( ) 


[n/2}! (2ey"” ’ 
i. e. there exist quantities y and 7’ independent of 4 and n such that 


2 Y 
<C,(a)<Pn*<PFn. 
(9) J2n+3—27 an () 
Consider now the polynomial 


(2) Sn(Z, 4) = Sn(Z) = Ps ils) 2 


where again A4:(4) 0. One can verify using the recurrence formula of the 
Hermite polynomials that 


Mel TGe ej)? BEE 


Integrating this differential equation we have 


(10) 


gmt, 


6, (2) = 8, (z)e"-** =1+42 ee) | che nea, 
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Formula (10) shows that if H,(4)<0 and x>0, then o,(x) is a mono- 
tonously decreasing function having one positive zero x,(A). It will be shown 
that supposing 20, x,(a) is the zero of least modulus of the complex 
function o,(z). For consider a complex number z, the modulus of which is 
less than x,(A). Then choosing as path of integration the straight line segment 
connecting O with z,, we have (C—&+/n) 


utes) —=|1 +2 1 emg z 


Sah ee set fieruer™ \de| —_ 
= 0 


|20| 


14 27D | cpr alte 
0 


l2o| 
>] 4.2 fn) =) | il"*e €24+-72- *alel S| = 
0 


= 64 (|Zo|) > Fn (Xu(A)) =0 
and so |0,(2)|>0. 


§ 4 
Let % and 4*,, be the quantities defined in § 1. It is known that 
o 
lim — Aut ——n 


Denoting the quantity x,(d%1) by /n-++-1x® our task will be to inves- 
tigate the asymptotic behaviour of x” as n tends to infinity. Writing in for- 
mula (10) instead of z, ¢ and 4 the quantities /n+-1x, /n+1& and 2%, 
respectively, we have 


r(x, 9) = 6,(Va-+1x, Ata) = 


(11) £12 2 Haldrss) (y n+1)> * fem 82a FTE 


beth) ss o n+1 n,,\ntl 2 Sh isege art i . 
at ctf (/2e) exp|(n + 1)—2 2 (a+ I)E+ (=) Ja 


where 
Cr = C,(A2,1). 
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Now the only positive root of the equation, f,(x, *)—0 is x and our 
task will be. to seek upper and lower bounds of this root. To get these 
bounds we will majorize and minimize the function f,(x, 9%) by two other 
functions, each monotonously decreasing for positive x’s. With the lp of 
the positive zeros of the latter functions we will estimate x. 

If x>0, we have, using (9), 


? cy n+l 
11a [Ve exp g (E . Ta || d&é<f, (x, F) < 


ee |V2eeexpe( An | as 
ey Ant yi " V2n+2 
Vn+1 
g(& O)=F+42/205+ 6 


is in the case of positive —’s and @’s a monotonously increasing function of 
these quantities. As for any positive « and sufficiently large n 


where the function 


at drs eo G4 e 
V2n+2 ‘ 
therefore 5 
he ' 
Zé, —9<e(6 — jess) <g(&, F+e) 


if n is sufficiently large. 
Consider now the monotonously decreasing functions 


k.(x)=1—L'n } [V2eze" "aE 


and 
K,(x) = — eB ( [Veber a, 


We have ; 
kn (x) <fr(x, F) < K(X) 


and the positive zero x x” of fa(x, #) lies between the positive zeros of k,(x) 
and K,(x). 

We now define the quantity x‘ as the sl: zero of the equation 
(3) V2eee% > 
where we regard © as a constant ee It is to be seen that x is a 
decreasing function of 0. 
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Further if x<xt) and n—>oo, then k,(x)—1 and if x>x®° and n+, 


then K,,(x)—-—oee. el 
For if x<x*), then in the interval OS§=x the function //2e&e! 


is less than g where g<1, and so 


I—k,(x) = Pn | [V2eke" YY" aE < Pnxgq"' 0. 
6 t 


On the other hand, if x><*-© and the value of the monotonously in- 


creasing function /2e8e"* at the place -(x° 9+.) is r (r>1), then 
a(O-e) 
eae 
Jiv2eee# sis a l J [V2eger* Pp ge =e AP on, 
x(O- Ee 


Therefore for any positive 7 and sufficiently large n it holds 
fa(x@+9 —7) > kn (x) —7) >0 


In(X?-) + 0) < Kn(x?9 + 9) <0. 
Tending with « and 7 to O we have 
lim x? — 


n+>@ 


where x is the positive root of the transcendental equation (3). 


and 


o 
Pant 


§5 


Returning now to formula (2’) we can insert in the place of D,(A) the 
quantity /n x, and using (9) one has 


1 1 
a SAG 
where 
(12) A® — [/2ee*x]". 


We have now to search for a value of # for which A® is large. Numerical 
calculations show? that . 


A®—=1,15, A® 1,395; x —=—0,3731, x —0,1131. 
The quantity A® considered as a function of ® has a maximum in 


dA) 
add 


* The numerical calculations were performed by A. Heppes to whom | express my 
gratitude. 


0< <1 only when —~-=O. Now the interval where the derivative of A® 


AN ESTIMATION IN THE THEORY OF DIOPHANTINE APPROXIMATIONS 307 


may vanish can be estimated as follows. Differentiating equations (3) and 
(12) with respect to # and equating this last expression with 0, we have 
xX +x(2xx’'+2V2x+4+2)/2 9x’ +29)—0, 
29x+x' =—0. 
(The differentiation is denoted by a prime, x stands for x® and % is the 


place of a possible extremum or inflexion of A.) Eliminating x’ from these 
equations we have 


1 
x = —— —/2%. 
V29 
But we know that x%<x<x (§ 4), ie. 
0,113< —|_ _y29<0,374 
\29 


or 0,59<.4+<0,67. From these data a rough graphical estimation shows that 
the place of the extremum is near to *#—0,642. At this place we have 
A® — 1,473. 


(Received 25 April 1958) 
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ON AN EXTREMAL PROBLEM 


By . 
I]. DANCS (Budapest) 
(Presented by P. Turdn) 


In his book’ P. TuRAN raised new problems of the theory of diophantine 
approximations and the results of the theory are applied to various problems 
of the analysis and analytical number theory. Pushing further these researches 
he got recently to a general extremal problem, the general solution of which 
would imply the improvement of the applications. This extremal problem is 
the following : 

Let 2,, 2,...,2, be complex numbers with absolute value 1, k of them 
are fixed: z,—«@,, Z,—=@,...,2,%==@, furthermore 


() o-H (—z2)—=1 + Sa? 

(2) oy —1+> ay2’, 

(3) Sm(Z)=1+ x at 2! 

and 

(4) Went Baas oo En) J [-f@)su(@Fla21, 


The general question is: what is max /(Zx41, Zn42, . ++, 2n) when Rutty Zk+2) 0+ +5 Zn 
vary independently on |z|—1. 

In this paper we solve the special case kK=1. This case was also 
solved by E. Makai.’ His proof*is different from ours. We shall prove 

THEOREM 1. Jf kK=1 and |a,|=1, then dies af Gi Za «+ +5 2n) 

24=@,, |%|=1,..., |2_ |= 
is attained only for a, =2,=2,—=:--+:= 2, and its value is 
m+n 


2a > 


vy=m+1 


BolT renal 


AP, Turn, Eine neue Methode in der Analysis und deren Anwendungen (Budapest, 
1953), Akadémiai Kiado. 

2 E. Makai, On a maximum problem, Acta Math. Acad. Sci. Hung., 9 (1958), pp. 
105—110. 
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PRroor. Without loss of generality we may suppose z,—«@, 1. For the’ 


proof we write /(2,,22,..., 2,) = | [I—f(e*) sn (e'*) Pg. Introducing the nota- 
0 


m+n . 
tion g(z) =1—f(z) $n (z) = radi oe 2 we may observe, as in’, p. 40, that 
v=1 


a? = a® =...—a% —0. 
Hence 
mtn > : 
(5) 1(2,, Zap 00) Sale 2H, ae i as ee 
v=m-+1 ; 
Our assertion will be proved if we can show that |a°| — for all our »’s — 


attains its maximal value if and only if z,—=2z,—=---—=z,—1. From (1), (2) 
and (3) it follows easily that 


(4) l 
(6) Cie lore 1) : > : Zi Ziq" Zip 
1Sji<je<-.< Sn 


(7) P= >. xztap'---20", 
Mythgt..-+iy=l 
H4=0, Hs=0,..., u,=0 


further 

(3) 2) (0 2 1 

a = — (a? a? n +n 10e mst + +++). 
Hence 

(3) te eet 
(8) ay = o, Qt, Igy..er by 2h 22° **Zyy 


Ltlyt.n tly, =v 
1,20, 15=0,...,1,=0 


f (3) P ; 5 
Obviously, |a, = — lait sid ;,| and the equality occurs if and only if 
1 gree. n— 


2, = 2% —=++-=2Z,—=1, provided that the sign of each a@,,1,,....1, (a tht: + 
+1,=¥v; |20,14=20,...,/,2=0) is for each fixed » the same. This is what 
we shall prove. 

Qi,,1,,...,1, Will be determined explicitly. At first we consider what is the 
contribution Of —Am Asm tO Ay, 1,,...,- From (6) and (7) it is clear that 
zizde-z" (4 +b+-+-+1,=7) occurs as often in a®a%,, as many-times one 
may choose »—m at a time from the positive /,’s. Denoting by i the numbers 
of the positive J,'s in.a.fix 4, kysa., bi (hteh-e- +1, ¥), this contribution 


amounts, taking also the signs into account, to (ym | 
isyv). 
B i Bs ar 
y the same reasoning we see that the contribution of —a%) a0) n41 to 


, (isn and 


m-1 


: . v-m+2 l 
Qi, tyyoy ly 1S (—1)”™ ne etc. Hence 


seis ll ae [ers] teers] eae 
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Taking the well-known property FA oar ea of the binomial coef- 


k—1 
ficients into account, and using i=n and i=», we get 
ce ee v-m+1 i—] 
(9) Dr, | ¥g5..-5 I = (—1) tlie Ba 
From this representation it follows that the sign of a@,,1,,...1, (atb++:-+ 
-+1/,—=v) is independent of /,,/,,...,/,. Hence the first part of our theorem 


is completed. 
For the proof of the second part of our assertion, from (6) and (7) 


taking into account that 


a? =(-1)'("] |] 
2 — fet) 
Po 


further the first part of Theorem 1, we write 


and if 2, a 2. een ae 2 |, 


m+n 
Medea Te) ane > MAK. Wile (23 Aisles Sa) = 
|23|=|4o=---=l2n|=1 vemt1 |2,|=|29]=...=]2_|=1 
m+n m+n 
nhs Ori qi yh (Ketel n |= 
Dz lait... P27 2 ny lym 
-(m+n—2 n 
| cel Necmaea) ep 
as asserted. 


As td the application we shall improve a main theorem of the book 
mentioned in’ This theorem is the following: 
Let 2, 22,+-+,2n and b,,b,,...,6, be arbitrary complex numbers and 
m=—1 integer. Then one can find such an integer v that 
m-Alsrsam-+n 
and 


n 


bat 4 baa eH Onze So ar n 
ee ie eat 18 | 5 ce eg 


Our assertion is that under the same conditions the following theorem 
holds : 


THEOREM 2. 
n-} 
— lOrt bate + bn) Gea 
{M= 2e 2e(m+n)) — 
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This improvement is not essential if n is large, but in the case n=2 


mr 


1 s 
this gives the real order in m, as the example Or Oe and z,=ée"4 
2,—=e ™™ shows. 

In this case 


|f(m + 1)| = 


It 
sin -—]< 


2m 2m 


cos ——— eat) - 


similarly 
IU 
Im +2)| <=, 
and from Theorem 2 
1 
ma v)| == >: 
eres 3 A) a 2e*(m + 2) 
PROOF OF THEOREM 2. It may be assumed obviously that min \2z;| == 
=j=n 


In this case one can prove that (see in’, p. 40) 


max (foe ater tot 
m+1lSvSmtn DS |A 
v=m4+1 


where 


| 1 
wah 22) 
: hikg ty ote z. 


in our notation. Obviously, 


|A?| = Ltd ja(1,1,..., 1}. 


3 
ma a1 
|2|=1, |zq|=1,..., |2,|=1 2 22 


From (9) we have 


(10) la (1, 1,.., vi= Zl, G1 )Po 


m 


where P(i) indicates that how many solutions are of the equation /,+/,+ 
+: +h,=y (420, ,=0,...,l,=0) by the condition: exactly i of the /,’s 
are positive. Obviously, P(i) is less than the number of the solutions of the 
equation 

G+44+-:-+4=yv—i (20/4, 20;44, 4.0) 
which is bariirie ti) 

n—1 | 

Thus from (10) 


jap, eek ise Si Estee | Oa eet |: 
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further 
ns (8); _— Sees i—1 y—i+tn—1 
a, | I= 2, = easel n—l \- 
yy li-l\(m+atl—’) S(m+n—K\(k—1 
=> 5| l }( i J=2( n—1 If 0 J+ 
ky {k+-1 n—1)| 
+(t)+( 2 J4-+(EZI)f. 
But 
fe | k ae n—1 n 
| 0 J+ (+ 2 | seco Hae ae 
and thus 


m+n n n 
(@)) — lerneis tc) fee tect) (7) lees 
ee rl au, Ne Et at <2 a1 Is 


J | 2e(m-+n) yo eget 


n n 


<<g2€ 


2e(m-+n) \ 
n 
from which our Theorem 2 follows. 


(Received 5 May 1958) 
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SUR LES COURBES IRRAMIFIEES 


Par 
A. CSASZAR et J. CZIPSZER (Budapest) 
(Présenté par G. Atexits) 


1. On connait bien le réle fondamental que deux espaces topologiques 
particuliers, Parc et la courbe simple fermée, jouent dans bien de problémes 
de la topologie. C’est ce role de grande importance qui explique le nombre 
trés considérable des travaux s’occupant de la caractérisation topologique de 
ces deux sortes d’espaces. Parmi ces caractérisations, il y a une, due a 
K. MENGER, qui mérite une attention particuliére, parce qu’elle est basée sur 
la notion trés intuitive d’ordre de ramification d’un point d’un espace topolo- 
gique, notion que l’on définit, en se bornant a des points d’ordre fini, de la 
fagon suivante: le point x de l’espace topologique R posséde |’ordre de. 
ramification n, en symbole: ord.R—n, si n est le plus petit des nombres 
cardinaux finis m tels que chacun des voisinages du point x contient un 
voisinage ouvert de x dont la frontiére se compose de m points au plus. 

Or, la caractérisation en question affirme que /’arc et la courbe simple 
fermée sont les seuls continus'’ métriques non dégénérés se composant exclusive- 
ment de points d’ordre 2 au plus.’ En appelant point de ramification tout 
point d’ordre supérieur 4 2 (y compris les points dits d’ordre infini, c’est-a- 
dire: les points qui ne possédent aucun ordre de ramification fini), on peut 
donc dire que /’arc et la courbe simple fermée sont les seuls continus métri- 
ques sans points de ramification, ou qu’ils sont les seuls continus métriques 
irramifiés. 

C’est F. FRANKL qui a réussi a généraliser les résultats cités de 
K. MENGER, en démontrant que si |’on remplace dans l’hypothése, les mots 
“continus métriques” par “espaces de Hausdorff connexes et contenant un 
sous-ensemblie dense dénombrable’, on parvient 4 une caractérisation topo- 
logique des espaces homéomorphes, soit 4 un segment, soit a une circon- 
férence, soit 4 une droite, soit 4 une demi-droite. De plus, il a montré qu’en 
supprimant |’hypothése de l’existence d’un sous-ensemble dense dénombrable,. 
Vénoncé reste le méme, pourvu que l’on substitue, dans la définition du 


1 Nous entendrons par continu un espace de Hausdorff connexe et (bi)compact; un 
espace est dit dégénéré s’il se compose d’un seul point. 
2 V. [7], p. 303; [8], p. 267. 
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segment, de la circonférence, de la droite et de la demi-droite, a l’ensemble 
ordonné des nombres réels, un ensemble ordonné quelconque dont l’ordre 
est continu.’ 

Le but de cet ouvrage est de donner une nouvelle démonstration aux 
résultats indiqués de F. FRANKL. Cette démonstration présente deux avantages 
vis-a-vis de la démonstration originale: d’une part, certaines étapes communes 
aux deux démonstrations ont été considérablement simplifiées (v. p. ex. la 
démonstration de la compacité locale, proposition (2.10)), de l’autre, la 
méthode de démonstration utilise la notion de connexité par arcs généralisés, 
ce qui permet des simplifications ultérieures lorsqu’on se borne au cas d’un 
espace de Hausdorff séparable* ou d’un espace métrisable. Dans ce qui suit, 
nous commencons par traiter ces deux cas particuliers, sans doute les 
plus importants au point de vue des applications, et passerons ensuite 
aux modifications nécessaires pour parvenir aux résultats géneraux. de 
F, FRANKL. 

Dans §4, nous présentons comme application de ces résultats une 
généralisation de la caractérisation topologique, due 4 K. MENGER, des ainsi- 
dites courbes ordinaires. On appelle courbe ordinaire un contenu métrique 
qui est la réunion d’un nombre fini d’arcs n’ayant deux a deux qu’une 
extrémité commune au plus, ou, autrement dit, un espace homéomorphe a 
un polytope connexe de dimension 1. Le théoreéme mentionné de K. MENGER 
affirme qu’un continu métrique non dégénéré composé exclusivement de points 
d’ordre fini et ne contenant qu’un nombre fini de points de ramification est 
nécessairement une courbe ordinaire.° 


Nous allons généraliser ce théoreme de.K. MENGER dans la méme 
direction que F. FRANKL I|’a fait quant a la caractérisation de l’arc et de la 
courbe simple fermée, en considérant des continus généraux au lieu des 
continus métriques. Notre démonstration présente, vis-a-vis de la démonstra- 
tion de K. MENGER, méme si l’on se borne a des continus métriques, 


8 VY. [3]. Nous reviendrons a la formulation précise de ces résultats au §3. Un 
résultat analogue a été démontré pour des espaces de Moore connexes irramifiés par 
F. B. Jones [5]. p 

4 C’est-a-dire admettant une base dénombrable. ' 

5 V. [7], p. 304; [8], p. 266. Il faut remarquer que la formulation du théoréme est 
inexacte A chacun des deux endroits cités, puisque la condition que l’espace ne doit con- 
tenir aucun point d’ordre infini manque de I’hypothése. Cette condition est tout de méme 
essentielle, comme le montre l’exemple de la réunion, dans le plan, d’une suite infinie de 
‘circonférences 4 rayons tendant vers 0 et contenant un point commun ow ejles possédent 
une tangente commune ; en effet, cet espace est un continu métrique se composant d’un 
seul point d’ordre infini et des points d’ordre 2 et lequel, pourtant, n’est pas une courbe 
ordinaire. 
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Tavantage de ne pas faire usage du théoréme profond appelé ’’n-Beinsatz“,° 
sur lequel K. MENGER a fondé sa propre démonstration. 


2. Dans ce qui suit, nous entendons par courbe irramifiée un espace 
de Hausdorff R connexe, non dégénéré et sans points de ramification, c’est- 
a-dire tel qu’on ait ord.R = 2 pour x€R quelconque. 


(2.1) R étant une courbe irramifiée, tout sous-ensemble connexe et non 
dégénéré de R est une courbe irramifiée. 


En effet, il suffit de remarquer que |’on a 


(2. 2) ord,.E =ord.R pour x€ECR, 
conséquence évidente de la formule 
(2. 3) Fre(Gn E)C(FrrG)n£, 


valable pour un ensemble ouvert G quelconque, ot! Frx Y désigne la frontiére 
de l’ensemble Y relativement a l’espace X.’ 


(2.4) Tout espace de Hausdorff R admettant une base composée d’en- 
sembles a frontiére finie est régulier. Si, en outre, R est connexe, il est 
localement connexe.® | 


DEMONSTRATION. Si x€ GCR et si G est un sous-ensemble ouvert de 
R, il existe un voisinage ouvert U de x tel que UCG et a frontiére finie: 
Fr U= {xo,..., Xn}. En désignant par U; et par V; deux ensembles ouverts 
tels que 

x€U;, xmEVi, UNVi=09, 

Pensemble V=UnUon---nU, est un voisinage ouvert de x tel que 
xEVOVCU—{x,..., }—UCG. 

La seconde partie de l’énoncé s’ensuit de la premiére par un raison- 
nement connu.° 

(2.5) R étant une courbe irramifiée, tout point x€R posséde des voisi- 
nages ouverts arbitrairement petits, connexes et dont la frontiére se coinpose de 
n points au plus, ot n=ord, R = 2; en particulier, R est localement connexe. 


DEMONSTRATION. La connexité locale de R est contenue dans la pro- 
position (2.4). En posant ensuite ord,R—n, on peut trouver des voisinages 
ouverts arbitrairement petits de x et dont la frontiére se compose de a points 
au plus. En remplagant ces voisinages par leurs composantes contenant le 
point x, on parvient aux voisinages exigés, eu égard a ce que, dans les 


6 V. [8], p. 214. . x 
7 Frz(GNE) = EN(GNE)—ENG cCENG— ENG =EN(G—G) = EN Fr,G. 
8 V. [3], th. I et II; [5], th. 3. 

9 V. p. ex. [6], § 46, IV, 1 ou [3], th. I. 
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espaces localement connexes, toute composante C d’un ensemble ouvert G 
est ouverte” et qu’on a Fr CC FrG.” 


(2.6) Si la courbe irramifiée R contient deux points d’ordre =1, R est 
compacte. 


DEMONSTRATION. On a par hypothése deux points a= 6 de R tels que 
ord.R = 1, ord, R= 1. 

Soit R=lUG" un recouvrement ouvert quelconque de R. Désignons 
par U, (et par U,) un voisinage ouvert de a (et de 5, respectivement), corf- 
nexe, compris dans un seul ensemble G”, dont la frontiére se compose d’un 
seul point au plus, et tel que 0¢U. (a¢U,). De méme si a+ x=+8, soit U, 
un voisinage ouvert de x, connexe, compris dans un seul ensemble G’, dont 
la frontiére se compose de deux points au plus, et tel que a, b€ U.. L’existence 
des voisinages de ce genre s’ensuit de (2.5). 

Or, les ensembles ouverts U., U, et Uz (a=_ x= 5) couvrent |l’espace 
connexe R, par suite il existe une suite finie U,,,..., Uz, telle que 


(2.7) aéU,,, b€U,,, Uz, 1U2,-0 (fae1 
On peut supposer que cette suite se compose du plus petit nombre possible. 
de termes. En ce cas, on a évidemment 
(2. 8) Xo=a, X»—=b, Uz,NUz,=O0 pour |i—s|>1. 
Les relations (2.7) et (2.8) ont pour conséquence 
0,00, 0, 0, —Us=50, 


ce qui entraine, U., étant connexe, l’inégalité Fr U.n U,,==0, équivalente a 
Vinclusion FrU,c U,,, puisque FrU, se compose d’un seul point. On obtient 
de la méme fagon FrU,cU,, ,. Enfin, pour 0<i<n,ona 


Uz, Us, 40, Us,;.,;—Us; + 0, 
Us, 0 Uzi, 9, Usi4,— Us, 0, 


i+1 
donc 
Fr U,;, 9 Uz,_, == 0 == Fr U;, 0 Uz 
ce qui entraine en vertu de U,, , U:z,,,;—=0O et comme FrU,, se compose 
de deux points au plus, Fr U,,C U:z, , U Uz;,,- 
Les inclusions obtenues impliquent 


i+1? ; 


10 V. [6], § 44, Il, 4. 
ul V, [6], § 44, Ill, 3. 
2 V, [6], §41, Il, 8. 
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de sorte que l’ensemble U Us, est fermé-ouvert, d’ot 
0 
R= U U:,, 
0 


vu que R est connexe. A plus forte raison, R peut étre couvert avec une 
suite finie des ensembles G’, ce qui montre que FR est (bi)compact. 


(2.9) R étant une courbe irramifiée, tout voisinage U d’un point x€R 
contient un voisinage fermé V de x, tel qu’il existe deux points a=-6 jouis- 
sant de la propriété 


a,b€V, ord.V=l1, ord, V=1 
et que V soit lui-méme une courbe irramifiée. 


DEMONSTRATION. FR étant connexe et non-dégénéré, |’égalité ord, RO 
est évidemment impossible. . 

Supposons qu’on ait ord.R—1. D’aprés (2.5) et (2.4), le voisinage U 
de x contient un voisinage ouvert U’ connexe et tel que U’CU, U’=+R, 
Fr U’ = {y}. L’ensemble V=U’ satisfait aux conditions de la proposition. 
En effet, VCU est un voisinage fermé de x, il est connexe, donc une 
courbe irramifiée (cf. (2.1)), et on a d’aprés (2.2) ord. VSord.R=1. De 
plus, on a ord, V=1; pour s’en convaincre, il suffit de montrer: l’existence 
de voisinages ouverts arbitrairement petits W de y tels que Vn FrW se 
compose d’un seul point au plus (cf. (2.3)). Or, s'il n’en était pas ainsi, 
posons z€ R—V et soit W un voisinage ouvert de y tel que z¢W et que 
FrW se compose de deux points au plus, mais que Vn Fr W contienne 
au moins deux points. On aura en ce cas FrWcV, donc UUW= 
=U’'UFrU’U WUFrWcU’'UW, en vertu des inclusions FrU’={y} c W 
et FrWCV=U’'UFrU’CU' UW. L’espace R étant connexe et |’ensemble 
U’ U W fermé-ouvert, il s’ensuivrait R= U’UW, ce qui contredirait a la 
relation z€U’ U W. 

Considérons ensuite un point x d’ordre 2: ord,.R—2. Soit U’cU un 
voisinage ouvert de x tel que la frontiére d’un voisinage ouvert U; c U’ 
quelconque de x se compose d’au moins deux points. D’aprés (2.5) et (2. 4), 
il existe un voisinage ouvert et connexe U” de x tel que U’ CU’, 
Fr U” = {a,b}, a=- 6. Il suffit de poser V—= U” et de montrer que l’on a 
ord, V = 1, ord; V=1. A ce but, nous montrons comme plus haut que le 
point a posséde des voisinages ouverts arbitrairement petits W tels que 
Vn Fr W se compose d’un seul point au plus. S’il n’en était pas ainsi, soit 
W un voisinage ouvert de a tel que WCU’, que FrW contienne deux 
points au plus et que Vn Fr W contienne au moins deux points. En ce cas, 
on a Fr WcV, donc U”UW=U"U W= U" Ufa, bs} U Wu Fr W= 


320 A. CSASZAR ET J. CZIPSZER 


—U" U{b} U W, en vertu de la relation a € W. Il s’ensuivrait Fr (Ur UW)c {5}, 
ce qui contredirait 4 l’inclusion U” UWCU’ et au choix de U’. Le cas du 
point & se traite de la méme maniére. 

Les propositions (2.6) et (2.9) ont pour conséquence immeédiate : 

(2.10) Toute courbe irramifiée est localement compacte. 

La proposition (2.4) entraine, en vertu du théoréme de métrisation de 
TYCHONOFF et d’URYSOHN: 

(2.11) Toute courbe irramifiée séparable est métrisable. 

La proposition suivante joue un rdéle fondamental dans ce qui suit: 

(2.12) Toute courbe irramifiée métrisable est connexe par arcs. 


DEMONSTRATION. D’aprés (2.10), une courbe irramifiée R quelconque 
est localement compacte. Or, un espace métrique localement compact est 
ouvert dans son complété,” donc topologiquement complet, ce qui entraine 
’énoneé d’aprés la connexité locale de R et le théoreéme de MAZURKIEWICZ— 
MOORE—MENGER.™ 

(2.13) Si la courbe irramifiée métrisable R contient une courbe simple 
fermée C, on a C=R. 

En effet, soit xe R—C, y€C, et z le premier point situé sur C d’un 
arc xy; on aurait ord, R = 3, ce qui est impossible. 


(2.14) R étant une courbe irramifiée métrisable ne contenant aucune 
courbe simple fermée, deux points quelconques a=-6 se laissent unir par un 
arc ab et un seul, et, parmi trois points distincts, il y a un qui est situé sur 
Varc qui relie les deux autres. 


DEMONSTRATION. Si A et A’ étaient deux arcs d’extrémités a et 5, 
posons p. ex. x€ A’—A et soient y et z les premiers points situés sur A de 
’arc xacA’ et xbCA’, respectivement. La réunion des arcs yzCA’ et 
yzCA forme une courbe simple fermée, contrairement a I’hypothése. 

Si a, 6, c sont trois points distincts tels que a¢bc, b€ca, cab, le 
premier point x situé sur bc de ab ne peut coincider ni avec 6, ni avec es 
on en tire ord,R = 3, ce qui est impossible. 


18 La plus simple démonstration de ce fait est la suivante: Soit R* le complété 
de l’espace métrique R, x€R et KCR un voisinage (relatif a R) compact de x. Si 
x, ER°—R, xi+x, soit {x,,;} une suite telle que x,;€R, x,;>x* pour i+oo, Pour na 
fixé, il n’y a qu’un nombre fini de points x,; qui soient compris dans K, puisque Xi XSEK 
et que K est compact, on peut donc trouver un indice i, tel que x,; € K, o(x,,; , xt) < =. 

’ ‘ n n 
Il s’ensuit Xyi, ~%, Contrairement a l’hypothése que K est un voisinage de x relativement a R. 


4 V. p.ex. [6], § 45, Il, 1 et § 45, I, 2. 
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(2.15) R étant une courbe irramifiée métrisable contenant deux points 
a+b d’ordre =1, R est un arc ab. 

En effet, si ord,R=1, ord, R=1, a=bb, soit AC R um arc ab. Si 
xER—A, soit y le premier point situé sur A d’un arc xa. Or, y—a impli- 
querait ord.R= 2, y—6 impliquerait ord,R=2 et a--y-b impliquerait 
ord, R = 3, inégalités qui sont toutes impossibles. 

(2.16) Dans les hypothéses de (2.14), tout ensemble compact KCR est 
contenu dans un arc ACR. 

En effet, on conclut de (2.9) et de (2.15) que K peut étre couvert par 
une suite finie d’arcs ajb; (i=1,...,n). Or, la réunion des arcs ab et 
bc étant identique a l’arc bc, ac ou ab suivant que l’on a a€bc, beac 
ou cé€ab (v. (2.14)), on constate que l’ensemble ai61 U b)a2U azb2U «++ U 
U Qn-1On-1 U On-14, UQn5, est un arc ACR contenant K. 

(2.17) R étant une courbe irramifiée métrisable, si ab CR est un arc, 
tout point x€ab, a+ x= 6 est un point intérieur de ab. 


DEMONSTRATION. Soit U un voisinage ouvert et connexe de x tel que 
a, bGU (cf. (2.5)) et posons ye U—ab. L’ensemble U étant, d’aprés (2. 1), 
une courbe irramifée métrisable, il contient en vertu de (2.12) un arc yx. 
En désignant par z le premier point situé sur ab de l’arc yx, ona a+2-+), 
donc ord.R = 3, ce qui est impossible. 

Les propositions établies permettent de démontrer les deux théorémes 
suivants : 

THEOREME I. R éfant une courbe irramifiée séparable, R est homéomorphe, 
soit ad un segment, soit a une circonférence, soit d une droite, soit a une demi- 
droite. 

_. DEMONSTRATION. D’aprés (2.11), R est métrisable. Si R est compacte, 
elle est une courbe simple fermée ou un arc, d’aprés (2. 13) et (2. 16). 

En supposant que Rn’est pas compacte, elle ne contient aucune courbe 
simple fermée (cf. (2.13)) et elle est localement compacte (cf. (2. 10)), donc, 
en désignant par R*—RU{w} le compactifié d’Alexandroff correspon- 
dant, R* est un espace de Hausdorff connexe, compact et séparable, et on 
a évidemment ord,R* = ord,R <2 pour x€R. Or, on a ord. R* S 2, puisque 
les ensembles R*—K, ot! K est un sous-ensemble compact quelconque de 
R, forment un systéme fondamental de voisinages du point w, et que tout 
ensemble compact ACR peut étre renfermé dans un arc ab=ACR, (cf. 
(2. 16)) ce qui entraine d’aprés (2. 17) 

- oC R*—ACR*—K et Frae(R*—A) = FreeA = FreAc {a, 5}. 


16 V. [I], p. 93. 
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On voit donc que R* est une courbe irramifiée séparable et compacte, 
donc, en vertu de la partie démontrée de |’énoncé, une courbe simple fermée 
ou un arc. L’ensemble R= R*—{q@} est donc homéomorphe a une droite ou 
a une demi-droite, puisque si R* est un arc, w doit étre nécessairement une 
de ses extrémités, autrement |’ensemble FR ne serait plus connexe. . 


THEOREME II. Les énoncés du th. | restent valables sous Uhypothése 
que R est une courbe irramifiée métrisable.” 


DEMONSTRATION. II suffit évidemment de démontrer que l’espace R est 
séparable, ce qui est évidemment le cas si R est compact. Supposons donc 
que R ne soit pas compact, donc, d’aprés (2.13), qu’il ne contienne aucune 
courbe simple fermée. 

Soit a€R et posons Rk’ = R—{a}. L’ensemble R’ ne peut avoir que 
deux composantes au plus; en effet x, y et z étant situés dans trois compo- 
santes distinctes de A’, les arcs xa, ya et za sont compris, sauf le point a, 
dans les mémes composantes que leurs extrémités x, y et z, donc ils ne 
possédent d’autres points communs que a, ce qui entrainerait ord,R = 3. 

Il suffit donc de montrer que toute composante C de FR’ est séparable. 
S’il n’en était pas ainsi, C ne pourrait pas étre totalement bornée, elle con- 
tiendrait donc une suite infinie {x;} telle que o(x;,x,))=e«>0O pour i+/. 
Les arcs ax; sont tous séparables, l’inclusion CC Uax; serait donc impos- 


sible. Or, en posant x€C—Uax;, a€xx; impliquerait a€éC, puisque C est 
ouvert, donc connexe par arcs, et par conséquent xx:CC (cf. (2. 14)). Ega- 


lement d’aprés (2.14), on aurait x;€ax pour i—1,2,..., contrairement a ce 
fait que l’arc ax est compact. 


3. Afin de passer au probléme des courbes irramifiées quelconques, 
rappelons d’abord les définitions et les propositions suivantes. 

Soit R un ensemble (totalement) ordonné et supposons que l’ordre de 
R soit continu, ce qui veut dire, d’une part, que l’inégalité x <y entraine 
existence d’un élément z€R tel que x<z<y, de l’autre que si R—=AUB, 
AnB=0, A+0= 8, et si a€A, 6€B implique a< 6, en ce cas ou bien 
A contient un élément maximum, ou bien B contient un élément minimum. 

Posons : 


(—oo,a)={x:x<a} (a,+0c)—{x:x>a}, (a,b)={x:a<x<5} 
et munissons R de la topologie dans laquelle les ensembles de la forme 


'© Tandis que le th. 1 est un cas particulier des résultats de F. Franxt ((3}), 
l’énoncé du th. Il semble étre nouveau; v. tout de méme [6], § 46, V, 5. En se bornant a 
des courbes irramifiées métrisables complétes, la démonstration devient bien plus facile; 
cf. [2]. 
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(— ~,a), (a, + 0) et (a, 6) forment une base. De cette facon, R devient un 
espace de Hausdorff connexe et sans points de ramification, autrement dit, 
une courbe irramifiée (pourvu qu’il contienne au moins deux points). Si R 
contient un élément minimum a et un élément maximum 6 +a, ils’appelle un 
arc généralisé ab, a et 6 étant ses extrémités; si R contient un élément 
minimum, mais il ne contient aucun élément maximum, il s’appelle une demi- 
droite généralisée; si R ne contient ni élément minimum, ni élément maxi- 
mum, il s’appelle droite généralisée. Enfin, un espace de Hausdorff qui est 
la réunion de deux arcs généralisés dont les extrémités sont communes mais 
qui mont aucun autre point commun, s’appelle circonférence généralisée. 

D’aprés ces définitions, on démontre facilement les propositions suivantes: 

- (3.1) Tout arc .généralisé est compact; toute circonférence généralisée est 
une courbe irramifiée compacte. 

(3.2) A étant un arc généralisé, si a,b€A et a<b, l'ensemble [a, 6] = 
= {x:a=x=b)} est un arc généralisé ab. 

(3.3) R étant un espace de Hausdorff et ab et bc étant deux arcs 
généralisés tels que ab{\\bc=—{b}, R=abubc, R est un arc généralisé ac. 

(3.4) F==0 étant un sous-ensemble fermé dun arc généralisé A, F 
contient un élément minimum et un élément maximum. 

(3.5) ab et bc étant deux arcs généralisés, situés dans un espace de 
Hausdorff, leur réunion contient un arc généralisé ac. 

(3.6) C étant une circonférence généralisée, si x€C, l'ensemble C—{x} 
est une droite généralisée. 


Nous démontrons ensuite la proposition suivante, analogue a (2. 15): 


(3.7) R étant une courbe irramifiée contenant deux points a= b dordre 
= 1, R est un arc généralisé ab. 


DEMONSTRATION. Soit a + x= 6. En désignant par C une composante 
de R—{x}, on a FrCc {x}" et FrC= 0 (puisque R est connexe), donc 
FrC = {x}. Par conséquent, la frontiére d’un voisinage ouvert quelconque 
suffisamment petit de x rencontre l’ensemble C, ce qui entraine que le nombre 
des composantes de R—{x} est inférieur ou égal a 2. Or, ce nombre ne 
peut pas étre inférieur 4 2, en particulier, les points a et 6 appartiennent a 
deux composantes distinctes de R—{x}, autrement la composante de R—{x} 
qui contient a et 6 serait compacte d’aprés (2.6), donc fermée-ouverte,” 
contrairement a I’hypothése de la connexité de R. 

Désignons par A, et par B, les composantes de R—{x} qui contien- 


7 V. 6, § 44, Il, 3. 
18 Cf. (2.5) et [6], § 44, Il, 4. 


6 Acta Mathematica IX/3—4 
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nent a et b, respectivement. Si y€A,., y4=a= x, on a x€B,, parce que len- 
semble connexe B,U {x} réunit les points 6 et x sans rencontrer le point y. 

On en conclut que l’on peut définir un ordre (total) sur R de la fagon 
suivante : 
posons a<x pour x=-a, x<6 pour x+6, et, pour x, y=-a,b, soit 
x<y si et seulement si x€A,. . 

En effet, d’aprés ce que nous venons d’ établir, pour x= y, des relations 
x€A, et y€A, une et une seule est remplie (on pose naturellement A. —B, = 0, 
A, = R—{b}, Ba==R—{a}); de plus, x€A, et y€A, entrainent z€B,, par 
suite A, relie x 4a sans rencontrer z, d’o1 x€ Az. 

Désignons par R’ l’ensemble R muni de la topologie qui résulte de cet 
ordre. La topologie de R’ est identique a celle de R; en effet, les ensembles 
(— co,x)=A, et (x,-+0c)—8B, sont ouverts dans R, donc il en est de 
méme quant a l’ensemble (x, y)—= A, B,, ce qui veut dire que la transfor- 
mation identique de l’espace compact R (cf. 2.6)) en R’ est continue, donc 
un homéomorphisme. 

Eu égard a ce que R est connexe, on constate aisément que |’ordre 
introduit sur R est continu. 

Ceci établi, on arrive a la proposition suivante, analogue a (2.12): 


(3.8) Toute courbe irramifiée R est connexe par arcs généralisés (cest- 
a-dire deux points quelconques c=-d de R peuvent étre reliés par un arc 
généralisé cd < R). 

DEMONSTRATION. Soit A l’ensemble des points x€R tels que edit 
soit qu’il existe un arc généralisé cxcC R. R étant connexe, il suffit de 
démontrer que A est fermé-ouvert pour en conclure que A= R. 

Or, si x€A, soit V un voisinage fermé de x qui satisfait aux conditions — 
de la proposition (2.9). D’aprés (3.7), V est un arc généralisé, et il existe 
un point ye Vn A. En vertu de (3.2), V contient (pourvu que c=-y) un arc 
généralisé cy, ce qui entraine d’aprés (3.5) que x€A. Par suite, A est fermé. 

D’autre part, si x¢€A, soit V un voisinage fermé de x, remplissant les 
conditions de (2.9), donc identique 4 un arc généralisé. Egalement d’aprés 
(3. 2) et (3.5), on constate que Vc A; donc A est ouvert. 

Les propositions suivantes s’obtiennent de la méme maniére que les pro- 
positions (2.13), (2. 14), (2. 16) et (2.17), seulement on doit remplacer les 
mots “arc” et “courbe simple fermée” par “arc généralisé” et “circonférence 
généralisée” et appliquer (3.7) au lieu de (2.15), (3.8) au lieu de (2. 12), de 


méme que les propositions (3.1) 4 (3.5) au lieu des propriétés élémentaires 
‘analogues des arcs. 


(3.9) Si la cou irramifiée R contient une circonférence généralisée C, 
ona C=R. 
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(3.10) R étant une courbe irramifiée ne contenant aucune circonférence 
généralisée, deux points quelconques a6 se laissent unir par un arc géné- 
ralisé ab et un seul, et, parmi trois points distincts, il y a un qui est situé 
sur larc généralisé qui relie les deux autres. 


(3.11) Dans les mémes hypothéses, tout ensemble compact KCR est 
contenu dans un arc généralisé ACR. 


(3.12) R étant une courbe irramifiée, si abCR est un arc généralisé, 
tout point x€ab, a==x=+-b est un point intérieur de ab. 


On parvient enfin aux deux théorémes suivants de.F. FRANKL ([3]):” 


THEOREME Ill. R étant une courbe irramifiée quelconque, elle est soit un 
arc généralisé, soit une circonférence généralisée, soit une droite généralisée, 
soit une demi-droite généralisée. 

La démonstration est analogue 4 celle du th. I, sans faire appel a la 
séparabilité de R (et de R*). 


THEOREME IV. Si la courbe irramifiée R contient un sous-ensemble dense 
dénombrable, elle est homéomorphe, soit a un segment, soit a une circonférence, 
soit ad une droite, soit ad une demi-droite. 


DEMONSTRATION. L’énoncé résulte de th. III lorsqu’on remarque que, 
d’aprés (3.12), tout arc généralisé ACR contient un ensemble dense dénom- 
brable et qu’un arc généralisé de ce genre est identique a un arc (au sens 
ordinaire).” 

4. Nous formulons de la facgon suivante la gncralisation du théoréme 
de K. MENGER sur les courbes ordinaires: 


THEOREME V. Si le continu non dégénéré R ne contient aucun point 
d ordre infini et s’il ne contient qu’un nombre fini de points de ramification, 
il est la réunion d’un nombre fini d’arcs généralisés, dont deux quelconques n’ont 
d’autres points communs qu’une extrémité commune au plus. Si,.en outre, R 
contient un ensemble dénombrable dense, il est une courbe ordinaire. 


DEMONSTRATION. Si R ne contient aucun point de ramification, il est en 
vertu du théoréme III soit un arc généralisé, soit une circonférence généra- 
lisée (les droites généralisées et les demi-droites généralisées n’étant pas 
compactes), et satisfait par conséquent évidemment a |’énoncé. 


19 Le lecteur observera que la démonstration des théorémes Ill et IV ne fait pas 
usage des cas particuliers traités dans § 2; nous n’avons commencé par le cas des espaces 
séparables ou métrisables que pour mettre mieux en évidence le caractére élémentaire des 
raisonnements. 

20 En effet, un ensemble dense au sens topologique est évidemment dense an sens de 
Yordre, de sorte qu’on peut appliquer un théoréme connu de la théorie des ensembles 
ordonnés, V. p. eX. [4], p. 54, th. V. 


6* 
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Supposons donc que |’ensemble fini S des points de ramification de R 
ne soit pas vide. L’égalité R—S—O entrainerait que espace connexe R se 
compose d’un seul point, on a donc R— S20. 

Soit C une composante de R—S. D’aprés (2.4), R est localement connexe, 
donc C est un ensemble ouvert; de plus, on a évidemment ord,C = ord. R = 2 
pour x€C, de sorte que C est une courbe irramifiée ou il se compose d’un 
seul point. Cette derniére possibilité et, de la méme maniére, la possibilité 
que C soit un arc généralisé ou une circonférence généralisée, sont exclues, 
puisque en ces cas C serait compact, donc fermé, tandis que R est. connexe 
et que l’on a R—C DS-=£0. Par conséquent, C est soit une droite généra- 
lisée, soit une demi-droite généralisée. 

Supposons d’abord que C soit une droite généralisée et considérons 
pour x€C quelconque les ensembles (— ,x).* L’intersection d’un nombre 
fini quelconque de ces ensembles n’étant jamais vide et l’espace R étant 
compact, il existe au moins un point a€R tel que a€(—~,x) pour x€C. 
Si l’on avait aa’ et a, a’€ D.C), soient U et U’ deux voisinages 


ouverts disjoints de a et a’, respectivement, ayant des frontiéres finies; on 
pourrait construire aisément une suite infinie d’arcs généralisés x,x,,CC dis- 
joints et tels que x,€U, x,€U’, et il s’ensuivrait que chacun des arcs géné- 
ralisés x,x;, rencontre tant l’ensemble Fr U que celui Fr U’, ce qui est 
impossible, Fr U et Fr U’ étant finis. 
On a donc b) Cesena et on constate de la méme maniére |’exis- 
x 


tence d’un point 6 tel que {) (x, + ~©) = {Od}. 
xrEC 


On a naturellement a, b€C, et les composantes de R—S étant fermées 
relativement 4 R—S, il s’ensuit que a, 6¢€S. De plus, on a pour x, y€C, 
x<y légalité (—~,y)=(—~,x)Uxy, ce qui entraine (—~, y)—Cc 
cNn(—~,x= {a}. On obtient de la méme facgon (y, +c0)—Cc 


r<y 


cnt +~)= (b}, par conséquent C= Cu {a} u {5}. 
xz>y 


L’ensemble C est donc connexe et non dégénéré et, C étant ouvert, on 
a pour x€C ord, C=ord,C = 2. Nous montrerons qu’on a également 
ord, C = 2, ord,C = 2. En effet, si a= 6, les ensembles (— ~, x) U {a} for- 
ment un systéme fondamental de voisinages du point a relativement a C, 
puisque, d’une part, C—((— o, x) U {a})=[x, + o) U {6} est fermé, de l’autre 
que si un voisinage ouvert G du point a ne contenait aucun ensemble de 
la forme (— oe, x), l’intersection d’un nombre fini quelconque des ensembles 
(— ce, x)—G serait non vide, de sorte que, par suite de la compacité de R, 


21 Pour la notation, v. le début de § 3. 
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il existerait un point a’€ ()(—o,x)—G, ce qui entrainerait la relation 
otal ne Ct xEC 
a= a’'€ (| (— oo, x), dont l’impossibilité a été établie plus haut. On parvient, 
rEC 


Si ab, par un raisonnement analogue ala conclusion que les ensembles 
(— co, x) U(y, + 0) U {a} forment un systéme fondamental de voisinages du 
point a relativement a C. Or, la frontiére relativement 4 C de l’ensemble 
(— oo, x) U {a} se compose évidemment du seul point x, et celle de l’ensemble 
(— co, x) U(y, +00) U {a} (si a—=b et x < y) des deux points x et y. On a 
donc dans les deux cas ord,C=2, et on établit de la méme maniére 
ord,C =2 

L’ensemble compact C est par conséquent une courbe irramifiée. De 
facon plus précise, si a-_b, on a ordsC =1, ord,C = 1, donc C est un arc 
généralisé ab en vertu du théoréme III, tandis que si a=), C est une circonfé- 
rence généralisée, car autrement il serait un arc généralisé qui, privé d’un de ses 
points, deviendrait une droite généralisée, ce qui est évidemment impossible. 

On constate par un raisonnement analogue (méme plus simple) que si 
C est une demi-droite généralisée d’extrémité a, il existe un point 0€S tel 
que C est un arc ab. 

Convenons d’appeler arétes de R les fermetures des composantes de 
R—S. D’aprés ce que nous avons établi, une aréte est soit un arc généra- 
lisé dont l’une des extrémités, ou toutes les deux, appartiennent a S, soit 
une circonférence généralisée dont un point et un seul appartient a S. 

Si un point aé€S appartient a n arétes distinctes, on a évidemment 
ord.R =n. Par conséquent, un point quelconque de S n’est contenu qu’en 
un nombre fini d’arétes, d’ow il sensuit que le nombre des arétes est fini: 
=, (i=1,...,r). 

Dans espace connexe R, |’ensemble fini S est non-dense, de sorte que 


R=—R—S= UC. En décomposant chacune des arétes ayant la forme d’une 


circonférence généralisée en trois arcs généralisés au moyen du point de 
celle-ci commun avec S et de deux autres points, et chacune de celles ayant 
la forme d’un arc généralisé en deux arcs généralisés au moyen d’un_ point 
de celle-ci qui n’appartient pas a S, l’espace R sera représenté comme 
ja réunion d’un nombre fini d’arcs généralisés, dont deux quelconques n’ont 
d’autres points communs qu’une extrémité commune au plus. 
Si R contient un ensemble dénombrable dense, on conclut du théoréme 
lV que les ensembles C sont des droites ou des demi-droites (ordinaires), 
ce qui fournit la seconde partie de 1|’énoncé.” 
' 2 Bien entendu, si l’on suppose que l’ensemble R est métrisable (ou, ce qui veut 


jire la méme chose, qu’il est séparable), on peut faire intervenir dans la démonstration le 
théoréme I (ou II) au lieu des théorémes Ill et IV. 
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Le lecteur observera que la démonstration précédente reste valable 
si l'on remplace l’hypothése que R ne contienne aucun point d’ordre infini 
par celle que R admette une base composée d’ensembles a frontiére finie, 
sauf la derniére proposition d’aprés laquelle le nombre des arétes est fini. 
Légalité R—=R—S=UC, reste tout de méme valable, ou les ensembles 


C, désignent les composantes de R—S. En effet, soit aéS et désignons par 
U un voisinage ouvert de a tel que U ne contienne aucun autre point de 
S et dont la frontiére est finie. L’égalité R—R—S—UC, étant évidente, si 


U ne rencontre qu’un nombre fini des ensembles C,, a appartient a la ferme- 
ture d’un de ceux-ci. Si U rencontre une infinité des ensembles Cy, il y en 
aura une infinité qui sont contenus entiérement dans U, autrement une infi- 
nité des C, rencontreraient la frontiére (finie) de U. Or, si Cyc U, ensemble 
Cc, <U contient, comme nous l’avons vu, au moins un point de S, qui ne 
peut étre autre que a. En tout cas, on a donc a€UCy pour AES. 


: Y 

Or, I’hypothése que l’espace compact R ne contienne qu’un nombre 
fini de points de ramification entraine l’existence d’une base composée d’en- 
sembles 4 frontiére finie.” De cette facon, nous avons démontré le théoréme 
suivant: © 


THEOREME VI. Si le continu non dégénéré R ne contient qu’un nombre 
fini de points de ramification, R est la réunion dune famille (de puissance 
quelconque) d’arcs généralisés, dont devx quelconques n'ont d'autres points 
communs qu'une extrémité commune au plus. Si, en outre, R contient un 
sous-ensemble dénombrable dense, ces arcs généralisés sont des arcs ordinaires 
et leur famille est dénombrable. 


(Regu le 7 mai 1958 ) 
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1. On doit 4 R.L. Moore la caractérisation topologique suivante de 
arc et de la courbe simple fermée: Si un continu’ métrique localement con- 
nexe et non dégénéré’ ne contient aucune triode,’ ce continu est soit un arc, 
soit une courbe simple fermée.' 

F. B. JONES a démontré que ce théoréme admet la généralisation 
suivante: Si un espace métrique non dégénéré, complet, connexe, localement 
connexe et localement compact ne contient aucune triode, cet espace est homéo- 
morphe soit ad un segment, soit a une circonférence, soit ad une droite, soit a 
une demi-droite.* 

Ce théoréme se raméne évidemment, au moyen du théoréme profond de 
K. MENGER appelé ”n-Beinsatz“,° au théoréme suivant: Un espace métrique 
non dégénéré, connexe et admettant une base composée d’ensembles dont la 
frontiére ne contient que deux points au plus, est toujours homéomorphe soit 
a un segment, soit a une circonférence, soit a une droite, soit d une demi- 
droite.’ 

Le but de cet ouvrage est de montrer qu’on peut supprimer des 
hypothéses du théoréme précédent la condition de la compacité locale et de 
donner 4a cette forme plus générale du théoréme une démonstration élémentaire, 
ne faisant pas appel au théoréme appelé ’'n-Beinsatz‘. 


2. THEOREME. Un espace métrique R non dégénéré, complet, connexe, 
localement connexe et né contenant aucune triode est homéomorphe soit a un 
segment, soit ad une circonférence, soit a une droite, soit ad une demi-droite. 

1 Nous appelons continu un espace de Hausdorff connexe et (bi)compact. 

2 Un espace topologique est dit dégénéré s’il se compose d’un seul point. 

3 Une triode est Ja réunion de trois arcs issus d’un point a et ne contenant deux-a-deux 
aucun point commun, sauf a. 

4 V. [6], p. 250. ; 

5 V. [3], lemma A. A vrai dire, il s’agit dans ce théoreéme de F. B. Jones, de facon 
un peu plus générale, des espaces de Moore complets. 

6 V. [5], p. 214. . 

7 V. [1], théoréme II. 
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DEMONSTRATION. L’espace R est connexe par arcs et localement connexe 
par arcs, en vertu du théoreéme de MAZURKIEWICZ—MOORE—MENGER.° 

Ceci étant établi, supposons d’abord que R contienne une courbe simple 
fermée C. En ce cas on doit avoir R—C; autrement posons xe R—C, y€C 
et soit z le premier point situé sur C d’un arc xy: on obtiendrait de cette 
facon une triode de sommet z contenue en R. 

On peut donc supposer que R ne contienne aucune courbe simple 
fermée. Il s’ensuit que deux points a + 6 de R peuvent étre reliés par un arc 
et un seul. En effet, si A et A’ étaient deux arcs d’extrémités a et 6, posons 
p.ex. x€ A—A’ et soient y et z les premiers points situés sur A’ des arcs 
xacA et xbCA respectivement. Les arcs yzCA et yzCA’ formeraient 
une courbe simple fermée contrairement a I’hypothése. 

Les points a, 6 et c étant trois points distincts de R, l’un d’eux est situé 
sur l’arc qui relie les deux autres. En effet, si l’on avait a¢bc, b¢ca, cab, 
le premier point x situé sur bc de l’arc ab ne pourrait coincider ni avec a, 
ni avec 6, ni avec c, de sorte que R contiendrait une triode de sommet x. 

Admettons a présent I’hypothése suivante: 

(*) R contient un point a tel qu'il n’existe pas deux arcs ab et ac ne 
contenant aucun point commun autre que a. 

Dans cette hypothése, on définit sur R un ordre (total) en posant x<y 
si et seulement si x€ay.° En effet on a toujours a€ay et, six+a+y, la 
relation a€xy étant inpossible d’aprés (*), on a soit x€ay, soit y€ax. De 
plus, x€ay et y€ax entrainent évidemment x —y. Enfin, x€ay et y€az ont 
x€az pour conséquence. 

S’il y a, dans cet ordre, un point maximum 8, |l’espace R coincide avec 
arc ab. Supposons donc qu’il n’existe aucun élément maximum. 

Nous montrons que les intervalles [a,x)—{z:z€R, a=z<x} et 
(x,y) = {z:Z2E€R,x<z<y} forment une base pour la topologie de R. En 
effet, ces ensembles sont ouverts, car, si z€(x, y), désignons par U un 
voisinage du point z connexe par arcs et ne contenant ni x, ni y, et posons 
t¢ U—(x,y); le premier point s situé sur l’arc xy de l’arc tzcU ne 
pouvant coincider ni avec x, ni avec y, on obtiendrait une triode de sommet 
s, de sorte qu’on en conclut Uc(x,y). On constate de la méme maniére 
que l’ensemble [a, x) est ouvert, en faisant appel a la condition (*). D’autre 
part, si z+ a, z€G et si G est ouvert, soient x’ et y’ deux points tels que 
x<z<y’; lintersection Gnx'y’ étant ouverte relativement a l’arc x’y’, il 
existe un arc xyCx’y tel que x<z<y et que xy C Getil s’ensuit évidem- 
ment z€(x,y)CxyCG. On raisonne de la méme maniére pour z—a. 


8 V. p. ex. [4], §45, II, 1. 
® On pose cd = {c} pour c—d. 
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L’espace R étant connexe, l’ordre établi sur R doit étre continu. Il suf- 
fit donc de montrer que R contient un sous-ensemble dénombrable dense 
(au sens topologique et par conséquent au sens de |’ordre) pour pouvoir 
appliquer un théoréme classique” et conclure que l’ordre de R est semblable 
a celui d’une demi-droite, donc que R est homéomorphe a une demi-droite. 
Or, si l’espace métrique R ne contenait aucun sous-ensemble dénombrable 
dense, il ne pourrait pas étre totalement borné, donc il contiendrait pour un 
¢>O une suite infinie {x;} telle que 0(x,, x;) =e (i==/). Chacun des arcs 
ax; etant séparable, il en serait de _méme quant a l’espace R si |’on avait 


i = Uax. D’autre part, si xe R— Uax:, on a nécessairement x;€ax pour 


1, Oe: .., contrairement a la compacité de l’arc ax. Cette contradiction 
montre que R doit étre séparable, et par conséquent homéomorphe a une 
demi-droite dont |’extrémité correspond a a. 

Il ne nous reste qu’a considérer le cas o1 R ne contient aucune courbe 
simple fermée et ot tout point a de R est |’extrémité commune de deux 
arcs n’ayant aucun autre point commun. Posons en ce cas a€R et désignons 
par C une composante de l’ensemble R—{a}. Si x€C, l’arc xa est contenu, 
sauf l’extrémité a, entiérement dans C, ce qui a pour conséquence que le 
nombre des composantes de R—{a} ne peut étre supérieure a 2, autrement 
R contiendrait une triode de sommet a. D’autre part, si ab et ac sont deux 
arcs tels que abfac= {a}, les points b et c appartiennent 4 deux compo- 
santes distinctes de R—f{a}, autrement la composante C de R—{a} qui les 
contient serait un ensemble connexe, ouvert” et localement connexe,” donc 
topologiquement complet et, par suite, connexe par arcs; C contiendrait par 
conséquent un arc bc, tandis qu’il existe un arc bac distinct du premier, ce 
qui est impossible. 

Ainsi l'ensemble R—{a} se compose de deux composantes. C étant 
une de celles-ci, l’ensemble Cu {a} est fermé, donc complet, connexe 
(puisque a€C, autrement C serait fermé-ouvert) et la condition (*) est évidem- 
ment remplie pour le point a relativement a l’espace CU {a} au lieu de R 
(vu que R ne contient aucune triode et qu’il contient un arc issu de a et 
contenu, sauf le point a, dans l’autre composante de R—{a}). L’ensemble 
C=Cu {a} est, de plus, localement connexe, puisque Fr C= {a} lest 
également. Eu égard 4 ce que Cu {a} ne contient aucune courbe simple 
fermée et que tout point x--a de Cu {a} est, par hypothése, |’extrémite 


10 VY. p. ex. [2], p. 54, th. V. 
11 VY. [4], § 44, Il, 4. 
12 V, [4], § 44, Il, 3. 
13 V, [4], § 44, Ill, 4. 
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commune de deux arcs n’ayant aucun point commun, sauf x, et qui peuvent 
étre évidemment choisis suffisamment petits pour étre contenus dans C, on 
peut appliquer la partie démontrée du théoréme et constater que CU {a} est 
homéomorphe a une demi-droite, le point a formant l’extrémité de CU {a}. 
Ceci étant valable pour chacune des composantes de R—{a}, l’espace R est 


évidemment homéomorphe a une droite. 

Ceci achéve la démonstration. 

COROLLAIRE. L’énoncé du théoréme précédent reste valable si R est un 
espace métrique non dégénéré, complet, connexe et admettant une base 
composée d’ensembles dont la frontiére ne contient que deux points au plus.” 


En effet, un espace R de ce genre est localement connexe” et ne 
contient évidemment aucune triode. 


(Recu le 7 mai 1958.) 
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“4 C’est un cas particulier du théoréme II de Vouvrage [1]. 
15 V. [4], § 46, IV, 1.- 


EIN BEITRAG ZU DEM SATZE VON CANTOR 
UND BENDIXSON 


Von 
G. FREUD (Budapest) 
(Vorgelegt von G. Avexits) 


In den folgenden Zeilen wollen wir eine allgemeinere Fassung des 
Cantor—Bendixsonschen Satzes geben, nach welchem eine abgeschlossene 
Menge in einem separablen Raum die Vereinigung einer perfekten und einer 
abzahlbaren Menge ist.' 

Im ersten Teil wollen wir uns mit einer Ait Neutopologisierung eines 
topologischen Raumes beschaftigen; diese enthalt als einfachste Spezialisie- 
rung den Fall, wenn man die Kondensationspunkte als verallgemeinerte 
Haufungspunkte betrachtet. Im zweiten Teil wird unter passenden einschran- 
kenden Bedingungen ein Satz hergeleitet, welcher auf diesen Spezialfall ange- 
wendet eben den Cantor—Bendixsonschen Satz ergibt. Im dritten Teil wer- 
den wir verschiedene weitere Spezialfalle der bewiesenen Satze aufzahlen. 


§ 1. Einfiihrung einer neuen Topologie 


R sei ein topologischer 7, Raum. In R sei eine nichtleere Klasse 2% der 
Teilmengen von R mit folgenden beiden Eigenschaften vorhanden:? 

I. Jede Teilmenge einer Menge der Klasse % gehdrt ebenfalls zu . 

II. Die Vereinigung zweier Mengen aus % gehdrt ebenfalls. zu Y. 

Es scheint treffend, fiir die °X-Mengen nach einem Vorschlage von Herrn 
Prof. P. S. ALEXANDROW (personliche Mitteilung) die Bezeichnung “fast leere 
Menge’’ einzufiihren. 

Wir nennen das Element c einen “-Haufungspunkt der Menge CCR, 
wenn fiir jede den Punkt c enthaltende offene Menge U.* die Beziehung 


(C a] U.)—c € SJE 
besteht. Sei C’ die Menge der %-Haufungspunkte von C; die Menge 
C=CuC’ nennen wir %-AbschlieBung von C. 


1 Vgl. K. Kuratowski, Topologie. I, 2. Aufl. (Warszawa, 1948), S. 141. 

2 Teilmengen dieser Art wurden zuerst von F. Hausporrr, Mengenlehre (3. Aufl., 
Leipzig, 1935), § 45, betrachtet. 

3 Im weiteren wollen wir, ohne es besonders hervorzuheben, mit Ua, Us, Uc,... stets 
eine den Punkt a, 6, c,... enthaltende offene Menge bezeichnen. 
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In diesem Paragraphen wollen wir zeigen, dab mit der A-Abschliebung 
eine neue 7, Topologie in R entsteht, d.h.* die folgenden Axiomen sind 
befriedigt:° 

a) AUB=AUB. 

b) Besteht A aus einem einzigen Punkt oder ist es die leere Menge, 
dann gilt A= A. 

c) A=A 

a) Wir zeigen zunachst, dab 
(1) (Au B) =A UB 
giiltig ist. Sei a€ AUB’, dann gibt es Umgebungen V. und W.,, so dab 
(Van A)—a €% und (W.n B)—a€ A besteht. Sei nun Uz= V.N W., dann ist 

[U.n(Au B)]—a=[(V.n W.)n (AU B)]—ac 
<[(V.n A) U(W.n B)J—a = [(V. n A)—a] U [(W. n B)—a] € O, 

da beide in den eckigen Klammern stehende Mengen des letzten Ausdruckes 
zu % gehdren (vgl. Il), also ist a€(AU BY’. Hieraus folgt (AUB) CA’UB. 
Anderseits ist A’ (AU BY. Istnamlich (An U.)—a€%, dann ist wegen Il 
umsomehr (AN U.)—ac [(AU B)n U,]—a € X. Ebenso ist B’ (Au BY, also 
A’u Bc (Au BY, und hieraus folgt (1). Wegen AU B=(AU B)u (AU BY = 
=(AUA’)U(BU B’)= AUB ist damit a) bewiesen. 

b) Die leere Menge Q gehért wegen I zu %. Infolgedessen ist Q — Q. 
Besteht A aus einem einzigen Punkt a, so ist (AN U.)—a—Q€ X fiir jedes 
U,; ist b=-a und a€ U,, dann ist auch (AN U,)—b—NEN, dh. A’=Q, 
A=AUA'=A, w.z.b.w. 

c) Nach (1) ist 

A=(AUA)U(AUAY =AUA'U A". 

Es bleibt zu zeigen, daB A” CA’ gilt. Sei a€ A”, dann ist fiir jedes 
U, (Un A’)—ae€X, infolgedessen gibt es einen von a verschiedenen Punkt 
a’ € U.N A’. Wir wahlen ein Uy mit a € Us C Un. Wegena’€ A’ ist (ANU.)— 
—a’€M und umsomehr AN Uy = (AN Us)—a EX. Diese Menge ist aber 
in (An U.)—a enthalten, daher ist auch (An U.)—a€M, also a€ A’. Damit 
haben wir den Beweis beendet. 


4K. Kuratowsk1, loc. cit. 1, S. 20. 
5 Diese Topologie ist mit der Urspriinglichen identisch, wenn % nur aus der leeren 
Menge besteht. 
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§ 2. Der Caritor—Bendixsonsche Satz 


Im weiteren wollen wir tiber die Klasse der Ausnahmemengen zwei 
weitere Vorzusetzungen stellen. 

Die Mengenklasse %* erfiille | und Il und auBerdem auch die folgenden 
Bedingungen: 

Ill. Die aus einem einzigen Punkt bestehenden Mengen gehéren zu 2’. 

IV. Gibt es zu jedem Punkt a€ A eine Umgebung U, dieses Punktes, 
fiir welche AN U,€ N” giiltig ist, dann ist auch AEX". 

Ein Punkt a ist dann und nur dann %*-Haufungspunkt der Menge A, 
wenn ANU, €%* fiir jedes U. besteht. Um das einzusehen, gentigt es zu 
zeigen, dab a) ANU,E XN und f) (AN U,)—a€E XM" gleichzeitig richtig oder 
falsch sind. Nach I folgt namlich #) aus @), und nach II und III folgt @) 
aus (). 

Im weiteren soll A’ die %*-Derivierte von A, A die 4*-AbschlieBung von 
A bezeichnen. 


HILFSsATz. Enthdlt die Menge BCR keinen einzigen seiner X*-Hdufungs- 
punkte, dann ist BCX". 


Bewels. Jeder Punkt 6€B hat eine Umgebung U, mit A ead 
also ist nach IV auch BC’. 


Satz |. Gilt fiir ein BCR die Beziehung Bn B’ € XY", so ist auch BEX’. 


Bewels. Nach Hilfssatz [| ist B—B’€M* und nach Voraussetzung 
BnB é€XN, also folgt B—=(Bn B’)uU(B—B)EM, w. z. b. w. 

Eine Menge nennen wir %*-perfekt, wenn sie aus ihren %*-Haufungs- 
punkten besteht. 


Satz Il. Jede U*-abgeschlossene Menge CCR ist die Vereinigung einer 
M*-perfekten Menge und einer X°-Menge, und umgekehrt. 

BeweEls. Es ist C=(C—C’)UC’. Nach Hilfssatz I ist C—C’ € %", und 
wir zeigen, daB C’ Y*-perfekt ist. Es ist zunadchst C’ CC’ (vgl. den Beweis 
von c) im § 1). Ist weiter c € C’, dann gilt U.n C € M* fiir jedes U., und wegen 
Satz I folgt hieraus (U.n C)n(U-n Cy €M*, umsomehr U.N C’€ A", da diese 
Menge die vorangehende enthalt. Infolgedessen ist c€C”, also C’CC”, d.h. 
C’=C’”; C’ ist 2*-perfekt. Die Umkehrung ist trivial: aus A— BUC, PB = B 
und CéY* folgt A’—B’ = BCA. 

SaTz III. Jede U*-perfekte Menge ist auch in der urspriinglichen Topo- 
logie des Raumes R perfekt. 

Bewels. Sei PCR eine 9*-perfekte Menge und a € P, dann gibt es ein 
U, mit U.n P€Y*. Die Menge U.n P kann keinen Y*-Haufungspunkt von P 
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und mithin auch keinen Punkt von P enthalten, d.h. sie ist leer. Also ist 
R—P offen und somit P abgeschlossen. P ist auch ‘in sich dicht, da alle 
seiner Punkte %*-Haufungspunkte und damit auch Haufungspunkte sind. 


§ 3. Anwendungen 


Als %°-Mengen kann man z. B. die folgenden Mengenklassen wahlen: 


a) Y* bestehe aus den separierten Mengen. (Eine Menge heift separiert, 
wenn sie keine nichtleere in sich dichte Teilmenge enthdlt.) 


b) 1" sei die Klasse der nirgends dichten Mengen, wenn R keine isolierten 
Punkte enthalt. 

c) Es sei t das Gewicht’ von R, o eine nichtabzahlbare Machtigkeit 
groBer als +. YX bestehe aus den Mengen, deren Machtigkeit héchstens 
gleich @ ist. 

d) R sei metrisierbar und habe keine isolierten Punkte. Y%° bestehe aus 
den Punktmengen erster Kategorie. 


e) R besitze die Lindeléfsche Eigenschaft (d. h. jede Uberdeckung einer 
beliebigen Menge mit offenen Mengen soll eine iiberdeckende Teilfolge 
haben). 2° soll 1, III erfiillen und sei abzahlbar additiv. (Aus dieser Wahl 
von %° ergibt sich der Cantor—Bendixsonsche Satz.) 


f) R sei ein separierbarer, metrischer Raum und Y%* bestehe aus allen 
Mengen, die Teilmengen von héchstens k-dimensionalen F,-Mengen sind. 
(Spezialfall von e).) 


g) R habe eine abzahlbare Basis, « sei eine absolut additive Mab- 
funktion, fiir welche jeder einzelne Punkt eine Nullmenge ist. * bestehe aus 
den Mengen vom u-Mafe Null. 

Meinem Kollegen J. CzipszER verdanke ich eine Reihe wertvoller Bemer- 
kungen. Insbesondere war die Einfilhrung der Bedingung IV seine Idee 
(Verf. formulierte den Satz urspriinglich nur fiir den Fall e)), und von ihm 
stammen auch die meisten der aufgezahlten Anwendungen. 


(Eingegangen am 31. Mai 1958.) 


6 Als Gewicht von R bezeichnen wir, wie iiblich, die kleinste Kardinalzahl >, fiir 
welche eine Basis der offenen Mengen in R der Machtigkeit » vorhanden ist. (S. L. Pontr- 
yaain, Topologische Gruppen, 2. Aufl., Definition 14.) 


BEMERKUNG UBER DIE KONVERGENZ EINES 
INTERPOLATIONSVERFAHRENS VON P. TURAN 


Von 
G. FREUD (Budapest) 
(Vorgelegt von P. TurAn) 


P. TURAN und seine Mitarbeiter studierten in mehreren Arbeiten’ die 
Interpolationspolynome héchstens 2n—1-ten Grades 


(1) Ral = S16) real) + Smt onl 


welche an n Stellen x,, vorgeschriebene Werte f(x,) und vorgeschriebene 
zweite Derivierte §,, besitzen. Es erwies sich am zweckmafigsten die n 
Grundpunkte x,, als Nullstellen von (1—x*)P;-1(x) zu wahlen, wobei P,(x) 
das Legendresche Polynom n-ten Grades ist, und n gleich einer geraden 
Zahl zu setzen. 

Es wurde im Teil I von * gezeigt, daB ein Polynom héchstens 2n—1-ten 
Grades durch seine Werte und die Werte seiner zweiten Derivierten an 
diesen Stellen eindeutig bestimmt ist. Fiir diesen Fall wurde unter geeigneten 
Bedingungen, welche u. a. die Differenzierbarkeit der interpolierenden Funk- 
tion voraussetzen, die Konvergenz des Verfahrens bewiesen. In den folgenden 
Zeilen geben wir, uns auf die Abschatzungen von J. BALAzs und P. TURAN 
stiitzend, ein verscharftes Resultat an. Wir wollen alle Bezeichnungen der 
dritten Mitteilung von J. BALAzs und P. TuRAN (loc. cit. ’) tibernehmen. 


Satz. Die stetige Funktion f(x) geniige der Bedingung 


(2) [F(x + h)—2f(x) +f(x—h)| S e(A) (ema) Xt) 6 lathe taal} 
mit 
0 in 


1 J. SurAnyi and P. TurAn, Notes on interpolation. I, Acta Math. Acad. Sci. Hung., 
6 (1955), S. 67—79, 

J. Batézs and P. Turn, Notes on interpolation. Il, Acta Math. Acad. Sci. Hung., 8 
(1957), S. 201—215. - 

J. Batdézs,and P. Turdn, Notes on interpolation. Ill, Acta Math. Acad. Sci. Hung., 9 
(1958), S. 195—214. 
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Die vorgeschriebenen Werte Byrn der Interpolationspolynome sollen in q 
gleichmafig den Abschatzungen 


Nl 2 < 2 
(4) |Brn| = | a (v=2, Kerrey ta WP | Pon| Seal, - |Ban| Sern 
mit 
(5) lim ¢, =O 


geniigen. Unter diesen Bedingungen konvergiert die Folge R,(x,f) der Turdn- 
schen Interpolationspolynome in [—1,+1] gleichmafig gegen f(x). 

Wir wollen zuerst eine Reihe von Ungleichungen, welche in der Arbeit 
von BALAzsS und TURAN bewiesen sind, erwadhnen: 
(6 wR pS 
Oin(X) = O(n ), Cun (xX) = O(n 2 ); 

: 1 Biel Ea . 

(Ta) yn (X) = O(N”) n(x) (1— Xn) V2 + O(n 2) ¥? [2 sv= ] 
und 


(7b) On(X) = O(1 *)bn(x)(1—Xon) (n—¥)? + O(n ?)(n—v)? 
(2 <7 =rn— 7 


{hierbei bedeutet J,,(x) die zu x,, gehdrende Lagrangesche Parabel des 
Grundpunktsystems X1,, X2n,..-, Xnn)} 


(8) Fin(x) = O(A),  Tan(x) = O(a); 

(9a) Tm(x) = O(n2)v 2 (2 = 3 

und 

(9b) ryn(x) = O(n? )(n—v) 2 (a <v¥s=n— 7 é 


Die aufgezahlten Abschatzungen sind der Reihe nach mit (3.1.1), Lemma 
3.1, Lemma 4.1 und Lemma 4.2 der dritten Arbeit von ' identisch. 

Es sei noch bemerkt, daB durch die Substitution x,.—cos Oyn 
{0 = 0,, =) aus den wohlbekannten Abschatzungen iiber die Nullstellen- 
verteilung der Jacobischen Polynome 

c c 

(10) 7} = Oy41,n — Own = - 
folgt.’ 

* Das Grundpunktsystem {x,,,} ist bekanntlich im Fejérschen Sinne streng normal 


und auch hieraus folgt (10) mit Hilfe eines Satzes von P. Erpés und P. TurAn: On inter- 
polation. Il, Annals of Math., 39 (1938), S. 703—724. 
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Das hat 
y —S 
(11a) C3 (1X)? a5 (2s7=4), 
a— ge o 
(11b) Geel, \t oo [F<*sn—1} 
zur Folge. 


HiLrssatz. Die stetige Funktion f(x) (—1=x=+1) soll (2) und (3) 
befriedigen. Dann gibt es eine Polynomfolge {®,(x)} mit den folgenden Eigen- 
schaften: 

a) der Grad von ®,(x) ist héchstens n; 


b) es gilt 
(12) f(x)— ®,(x) = o(n-')(V 1— x? +n“) 
gleichmdfig in x €[—1,4+ 1]; 

c) 
(13) @; (x) = 0(n) Min {(1—>?) 2, n} 


besteht in [—1,+ 1] gleichmdfig. 

Teil a) und b) dieses Satzes ist ein Spezialfall eines Satzes des Ver- 
fassers,’ wir zeigen mit Hilfe einer Idee von Herrn Prof. P.’TuRAN,‘ daB c) 
aus den Behauptungen a) und b) folgt. 


Wir setzen ny =n, n, =[n/2],..., Aju = [n,/2], .-., tr = 1; 
__| logan 
r= log 4 +1. 
Es ist 


Dux) = [Pay (0)— Da + Pula) 
und infolge (12) f 
Py(x)— Pn, (X) = 0(05')(V 1-2 + 13’). 


Da die linke Seite ein Polynom héchstens n;-ten Grades ist, ergibt sich aus 


der Ungleichung von DzjADIk° 
1 


Dry, (x) — Dy, (x) = 0(1)) Min [(1—x’) ®, nj] = 0 (3) Min [(1—x’) 2, n] 


3 G. Freup, Uber die Approximation reeller stetiger Funktionen durch gewdhnliche 
Polynome, Math. Annalen (im Erscheinen). 

4 Persénliche Mitteilung; der urspriingliche Beweis des Verfassers war verwickelter. 

5B. K. [aagux, O KOHCTPyKTHBHOM xapaKkTepucTHKe dyHKuKH, yOBNeTBOp- 
aroulux ycnosuw Lip « (0 < a < 1) Ha KOHeYHOM OTpe3Ke BeLeCTBeEHHOM OCH, Mga. Akan. 
Hayx CCCP, Cep. mat., 20 (1956), S. 623—642. 
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und weiter : 
D(x) = o(5 | Min [((a—x*) z , n] = 0(n) Min [((1 — x’) z , ni, 
w. z. b. w. im 


Nun wenden wir uns zum Beweise des Hauptsatzes. Es gilt (vgl. (1)) 


Ru(x3 f)—F(x) = Ra(x3 f— Pn) + Pr(x) —F(x) = 
©) = SY) Pala real) +S (Bm — BE CH) een(@) + 0(0). 


Es ist infolge (8), (9a), (11a) und (12) 


D [)— Oa) Fon) = 


1 
ey 


(15a) — 0(n-2)O(n) + dor) O(n2)y : 


tw] 2 


=o0(n)+o(n 2d ney o(1) 
und infolge (4), (6), (7a), (11a) und (13) 


Pai [Brn — Dry (Xn) Orn (x) = 


1 


=o0(n)O(n 4 Som * oe: 21, (2 sal 


n 


= 00h 0(0) v3) = 


n 1 1 


sai Secs z 
= on) +o(n9(S] (Leeo) - 
Nach einem schénen Satze von L. FEjJER® gilt 


> 40) Lanftiriex:€ lesdget- 2k 


6 L. Feyér, Bestimmung derjenigen Abszissen eines Intervalles, fiir welche die Quad- 
ratsumme der Grundfunktionen der Lagrangeschen Interpolation im Intervalle [—1, + 1 
ein mdglichst kleines Maximum besitzt, Annali della Sc. Norm. Sup. di Pisa (2), 1 (1932) 
S. 3—16. 
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Es folgt also aus den beiden letzten Beziehungen 


(16a) &, [Bon — Dei (Xn) 2on(X) = 0(1). 


Auf dieselbe Weise wie (15a) und (16a) ergibt sich aus (8), (9b), (11b) 
und (12) bzw. (4), (6), (7b), (11b) und (13) 


(150) D (fe) — Pal )Iron) = 0(0) 
bzw. ah 
(16b) 2 [Brn — D; (Xyn )]@on(x) — o(1 ). 


Aus (15a), (16a), (15b) und (16b) folgt dann wegen (14) die Behauptung 
des Satzes. 


MATHEMATISCHES FORSCHUNGSINSTITUT : 
DER UNGARISCHEN AKADEMIE DER WISSENSCHAFTEN 


(Bingegangen am 6, Juni 1958.) 


7 | = an 
ao sess ecwmnw Bd WINE collet 


vis - ies ~ eda > 


» Jue ’ 
ada 1) a ie 
CS Sin, oe 

(je ihe) 


a” es ie <M), (Tha) wary 062) 


i ee 
sams a3) Pt) ee 4 ee J { : | ; 


ie 

7 . 
| = 4S aoe — 
we |b 3 Over ; me aikaga! HOF 


ores ct ae ce 


> 
aa a 


7 (Me Se 


, & ; : oe 
j uA i o oe Wisk - om 


7 


(aaa lar kaif a | 
a ha 


a Sede - ed) 7 qo4 - _ a git 


~y! ake 4 ~~ - céisiins bh : a } 


rr ont 


i .” L “6 toe t¢ » apelin) Gitee Waeatnng, fiy Seideae 
we! fe ee sop Gt _adreon tee Weereeeia lay ia 
vp Ane as rete. TT bed tlie & haw 


EINE CHARAKTERISIERUNG DER HALBEINFACHEN RINGE 


(ERGANZUNG ZU MEINER ARBEIT ,BEITRAGE ZUR THEORIE 
DER OPERATORMODULN‘) 


_ Von 
A. KERTESZ (Debrecen) 
(Vorgelegt von L. Répet) 


In einer friiheren Arbeit [1] ist der folgende Satz bewiesen: 

Ein Ring’ R ist dann und nur dann halbeinfach (ad. h. ein Ring, der 
keine von Null verschiedenen nilpotenten Linksideale besitzt und fiir Links- 
ideale der Minimalbedingung geniigt), falls er ein Einselement hat und der 
linksseitige Annihilator eines jeden (==0) Elementes von R der Durchschnitt 
‘von endlich vielen maximalen Linksidealen des Ringes R ist. 

In Zusammenhang mit diesem Satz wird (auch in [1]) die Frage ge- 
stellt, ob der Satz seine Giiltigkeit behdlt, wenn man statt der Existenz des 
»Einselementes* nur die Anwesenheit eines ,rechtsseitigen Einselementes“ 
erfordert. Das Ziel dieser kleinen Note ist zu zeigen, daB die Antwort auf 
diese Frage affirmativ ausfallt. Wir beweisen den folgenden 


SATZ. Fiir einen Ring R sind die folgenden beiden Bedingungen dqui- 
valent: 

a) R ist halbeinfach; 

8) R ist ein Ring mit rechtsseitigem Einselement und der linksseitige 
Annihilator eines jeden (4-0) Elementes von R ist der Durchschnitt von end- 
lich vielen maximalen Linksidealen des Ringes R. 

Zum Beweis werden wir die folgenden Hilfssatze benutzen: 

HiLFssatz 1. Ein Ring ist dann und nur dann halbeinfach, falls er ein | 
Einselement besitzt und eine direkte Summe von endlich vielen minimalen 
Linksidealen ist. (Siehe [3], § 123.) 

HILFSSATZ 2. Es sei R ein beliebiger Ring. Der linksseitige R-Modul G 
ist genau dann eine direkte Summe von endlich vielen minimalen Untermoduln, 
wenn in G eine endliche Menge von maximalen Untermoduln existiert, die als 
Durchschnitt das Element 0 haben. (Siehe [2], Lemma, S. 231.) 

Nun sei zuerst a) erfiillt. Dann enthalt R, auf Grund des Hilfssatzes 1, 
ein Einselement, und es existiert eine direkte Zerlegung 


(1) R=L+-::+k, 


1 Ring bedeutet hier immer einen assoziativen Ring. 
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wo die L; (i=1,...,&) minimale Linksideale von F sind. Jedes Element 
r(€R) wird offenbar genau durch diejenigen Elemente annulliert, welche 
sdmtliche, der Zerlegung (1) entsprechende Komponenten des _betreffenden 
Elementes annullieren. Um zu zeigen, daB fiir R die Bedingung £) erfiilt 
ist, ist es somit gentigend, den Nachweis zu erbringen, daB der linksseitige 
Annihilator A eines beliebigen Elementes /(=-0) von L; ein maximales Links- 
ideal des Ringes R ist. Es sei s ein beliebiges, in A nicht enthaltenes Ele- 
ment von R. Dann gilt O-- s/(€ L,), und wegen der Minimalitat von L; ergibt 
sich die Existenz eines Elementes ¢(€ &) derart, daB ts/ =, d. h. (1—ts)/=0 
ist. So ist (I—ts) €A, was zeigt, daB das von A und s erzeugte Linksideal 
mit dem ganzen Ring R iibereinstimmt; somit ist A ein maximales Links- 
ideal von R. 

Umgekehrt gelte jetzt @) fiir den Ring R. Wenn e ein rechtsseitiges 
Einselement und r ein beliebiges Element von R ist, dann gilt s(er—r)= 
= (se)r—sr=0 fiir jedes Element s(€ A). Darum ist der linksseitige Anni- 
hilator von er—r der ganze R, und folglich gilt kraft der Eigenschaft 
8) er—r—O; somit ist e ein zweiseitiges Einselement. Dabei besitzt R, da 
der linksseitige Annihilator von e die O ist, endlich viele maximale Links- 
ideale, die den Durchschnitt 0 haben. Deshalb ist R auf Grund des Hilfs- 
satzes 2 eine direkte Summe von endlich vielen minimalen Linksidealen. 
Wir wenden jetzt noch den Hilfssatz 1 an, und damit ist der Beweis des 
Satzes erbracht. 


(Eingegangen am 18. Juni 1958.) 
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ON SOME INTERPOLATORY PROPERTIES 
OF LEGENDRE POLYNOMIALS 


By 
R. B. SAXENA and A. SHARMA (Lucknow, India) 
(Presented by P. TurAn) 


1. In most of the problems. of interpolation we prescribe the values of 
a function at each point x,, and of some of its consecutive derivatives there. 
Thus in the Hermite interpolation formula, the value of the function and its 
first derivative are prescribed at some points in a given -interval. A general 
problem of interpolation was treated by BIRKHOFF, who considered a system 
of pairs of numbers (kj, xi) (i= 1, 2,...,) where k; are integers =O and 
xX; are any points in a given interval. A more particular case n 2 was 
treated directly by POLYyA. A similar case in the complex plane has been 
treated by CINQUINI. But this general point of view does not bring out the 
character of the interpolatory polynomials. 

Recently in two papers, TURAN has opened a new line by considering 
what he calls (0,2)-interpolation, where the value of the function and its 
second derivative are given at some points. He considers the problem of 
their existence and uniqueness and also the problem of their explicit represent- 
ation. He has also promised a study of the problem of convergence. 

The object of this paper is to extend the programme of TURAN to the 
case of (0, 1,3)-interpolation, i.e. the problem of existence and uniqueness 
of interpolatory polynomials when the value of the function, its first and 
third derivatives are prescribed at a set of points. The other part of the paper 
obtains the explicit representation of these polynomials, in a most suitable 
form. The problem of convergence will be treated in the next communication. 

2. We seek a polynomial f3n-1(x) of degree = 3n—1, where the value 
of the function, its first and third derivatives are prescribed at the n points 
xX, where 


(2. 1) ae ac poe Xa, 
that is, we are given (Say): 
(2. 2) San-1 (Xv) =)r, Fin-1 (Xv) =YJ)>, Fan-1 (Xv) = Via (v sh i tie oe n). 


In order fo get the. simplest proofs, we choose the points (2.1) to be the 
same as those chosen by TuRAN and his associates for the case of (0, 2)-inter- 
polation, i.e. as the zeros 


(2. 3) — 1 Sb, SS ee Sr el 
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of the polynomials 

(2. 4) Tin (X) = (1 —X*) Pn-1(X) 

where P,-1(x) is the (n—1)th Legendre polynomial with P,-1(1) = 1. 
3. Let n—=2k-+1, and let ; 


(3. 1) 1 2X1 > Xe > > Xe > Xen =O > Xue See > Xe =! 
with 
(3. 2) Xj = —Xon+2-7 (j= 2", 2k+ 1). 


We shall prove 

THEOREM I. Jf n=2k-+1 and the points x, X2,...,Xn satisfy (3. 1) 
and (3.2), there is in general no polynomial f(x) of degree =3n—1 such that 
for given yy, yr and y; 
(3. 3) S(%) =r; f' (%) =r, Le) == > (v=1, 2» a 
If there exists such a polynomial, then there is an infinity of them. 

Thus in the case of an odd number of distinct symmetrical points x,, 
both the problem of existence and uniqueness have a negative solution. 

Taking x, as the points (2. 3) we shall show that in the case of infinitely 
many solutions in Theorem I for n= 3, the general form of the solution is 
(3. 4) fX)=h() + ch) 
where f,(x) and f,(x) are fixed polynomials of degree = 3n—1 and c is an 
arbitrary complex number. 

4. In the case of n even (= 2k) the situation changes. We shall show 


THEOREM II. Jf n= 2k, then to prescribed values y,, y;, y;* there is a 
uniquely determined polynomial f(x) of degree =3n—1 such that 
(4. 1) fE)=w, f'E&)=y and f''(—,)=yr — (v=1,2,..., 2) 
if § stands as in (2.3) for the zeros of z,(x). 
This means, of course, that in the case 


(4. 2) Y=), = y, =0 (yv=1,2,...,n; n even) 
the only solution of (4.1) is f(x)=0. This result is curious because the 
polynomial 


Qon (x) = 21 (x) 
Qon (Er) = Q’on(E,) = 0, 


but Qs, (€&) =O for v= 2, 3,...,n—1, i.e. there is a non-trivial polynomial 


of degree 2n satisfying almost the requirements (4. 2), i.e. all except the two 
conditions 


-has the property 


P61) =f" (En) = 0. 
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Theorem II shows that for n even there is no polynomial of degree = 3n—1 
Satisfying condition (4.2), except f(x)=0. 


5. If we replace in the interpolation problem (2.2) the points x, by 


the zeros 7} of the nth ultraspherical polynomial Pé(x) with 1>—> 


(fo 1=—4 we come back to the case of Theorem u) which satisfies 
the differential equation 
5. 1y> (1—x*)y’ — (24+ 1) xy’ +n(n + 2d)y =0 
with 
PEI) — iat) for 4--0, 
10 A: 


then by the method used by TuRAN and SurRANyI we get the following 


THEOREM III. Jf 24+2— odd integer = 3, A>—s, then in the 
case 4=n (even) = 24-+1, the only solution of (4.2) is g(x)=0. In case 
n=even and = 24--3, there is an infinity of solutions of the form 
(5. 2) 2 (x) =ck (x) 
where c is an arbitrary constant and k(x) is a uniquely determined polynomial 
of degree 2n+2A-+1. 

The proof of this theorem is omitted as it can easily be carried out on 
the same pattern as that of the corresponding theorem of TURAN—SuRANYI. 


6. We now prove Theorem I. We decompose the polynomial 
8n-1 


AB castes Cy X” 


into an even and an odd part ; 
3k+1 


: 3k 
S(x) = > Cx”, (x)= >, Copy 2741, 
v=0 ore 
The first part of the condition (2.2) will then give 


f (Xr) = SX) +t) = Wr, ai k 
Es) Sf (Xv) = 8(Xy) —t( Xr) = Yn-vit \aigeg ts 277 nale) 
Since s’(x) and ¢’(x) are odd and even polynomials, respectively, from the 
second part of the condition follows 

f (Xv) =8' (Xp) +0 (XH) =r, | =D k 
-2) f (Xv) = — 8 (Xr) +E (Ko) = Yn-vnt can egrey 
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Since s’’(x) and ¢’”’(x) are again odd and even, respectively, the third con- 
dition then gives 


(6. 3) Ff’ (Xr) = s’”’ (Xv) ie t’” (x,y) == yr | (y an 2) k). 


f(A Xn) = 8" (Xe) HO" (Xr) = Yrrvtt 
From (6.1), (6.2), (6.3) we get for ¢(x) 


1 
t(Xy) = 2 (Yr —Yn-v+1); 
, 1 * * 
(6. 4) t (xy =. 2 Or = Yn-v+i)s | (v = it. 2: eeey k) 


"(x)= 5 OF tytn 
and, of course, 
(6. 5) 1(Oj= 079 HO) =<, 17 (0) 6G. 
The coefficients to be determined are 3k-+1, out of which two are deter- 


mined from (6.5). For the remaining 3k— 1 coefficients we have 3k equations 
which is one more than the number of coefficients to be determined. 


For s(x) the equations (6. 1), (6.2), (6.3) give 


1 
S(x,) = 2D (Vr + Yn-v+1); 


(6.6) s'(x,) = +03 _y yy 462 Foae 
8” (2) = 5 OF —yhtvn) | 

and 

(6.7) s(0)=ca, s'(0)=0, s’’(0)=0. 


The coefficients to be determined are 3k+-2, out of which one is determined 
by (6.7). For the remaining 3k-+ 1 coefficients we are furnished 3k equations 
which is one less than the number of coefficients to be determined. Hence 
there are an infinity of solutions. 


7. As stated in § 3, we shall consider with an odd a, in the case of 
x,—=6&,, the general structure of the solutions. The assertion is obviously 
proved if we show that in our case all polynomials f(x) of degree = 3n—1 
satisfying 
(7. 1) f&) =f' (&) =f" &) =0 (Vas ls 20, ) 


are 


(7. 2) C Qon(X)(Pn-1(x)—2) 
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with arbitrary numerical c. If f(x) statisfies (7.1), the first part of the con- 

dition implies 

(7. 3) F(X) = Qn (X) Qn-1(X) 

where qn-1(x) is a polynomial of degree =<n—1. But the second part of the 

condition requires 

Bi, 4) Qs, (&,) Qn-1(&,) + Qon (E,) Qn-1(y) a 0 

which is automatically satisfied as the &’s are the double zeros of Qo, (x). 
The third part of the condition means 


Qsan (,) Qn -1 (E.) + 3 Coan (é,) Qn-1 (é,) + 3 Qin (5,) Qn- 1 (&,) + 


ey + Qua(Es) qia(E,) =0. 

Since 

(7.6) Qan(E>) = -Q3.(E,) =O for v= 1,2>..., A, 

we have 

(7.7) an (Er) Gn-1 (Sr) + 3 Q3n (Er) n-1 (Ev) =O. 

The differential equation satisfied by 

(7. 8a) . En (X) = (1 —X*) Pr. 1 (x) 

is 

(7.8) (1 —x?) zen’ (x) + n(n—1) 2,(x) =0 (Wea), 


Hence the differential equation satisfied by Qo,(x) is 

(7.9) (1— x? Qbi (x) + 4n(n — 1) (1 —x?) Qs, (x) + 4n(n— 1)x Qon(x) = 0. 
This gives } 

(7. 10) Ba (E,) =O (¥==2)3,.).,n—1). 


Therefore (7.7) gives 
gnil&,)=0-..(v=2,3, ...,n—1). 


But this means that qn-1(x) has all its zeros common with P,-(x), i.e. 
Qn-1(x) =cP,-1(x) with a numerical c. Hence if c=-0, 

n-1(X) =C{Pn-1(x) + cr}, 
that is 
(7. 11) F(X) = € Qen(X) (Pna(X) + 1). 
To determine c and c,;, we shall make use of f’(+1)—0. We shall now 
require the following known results : 


(7. 12) Pia(1)= 4-0 (n—1)=(—1)" Paa(—0), 
(7. 13) re, (1) = — n(n—1) =(—1)""' (1), 


(7.14) wi(l) = — 4 0(n— 1) = (— 1)" ai (—). 
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From the above three relations we have 

(7. 15) $n (1) = 2n?(n— 1)? = Q3,.(— 1), 

(7. 16) bn (1) = 313 (n— 1)? = — Qa (—1). 

The requirement /’’(1)—0 then gives with the help of (7.15) and (7.16 
Cc} = —2. Hence 

(7. 17) F(X) = € Qan(X) (Pn-1(X) — 2). 

For n odd it is easy to verify with (7.12), (7.15), (7.16) that the 
polynomial (7.17) satisfies also the condition f’’ (—1)—0. If c=O, then 
Qn-1(xX) = constant, i.e. f(x) would be cQ»,(x) with a numerical c; but ther 
f’(1) +0. Hence only the polynomials (7.17) fulfil our requirement. 

- 8. The proof of Theorem II in the case of n even runs parallel to tha’ 
of Theorem I. In the case of n even, it is proved also that if 
(8. 1) fE)=f' &) =f" &) =0, 
then f(x) has necessarily the form (7.17) with numerical c, without using 
the requirement f’”(—1)—0. 

For even n it can be seen with the help of formulae (7.12) to (7. 16) 
that 


d® 
| (Qan(XPu-i(s)—2))|_ +0. 

Hence c= 0, i.e. 
(8. 2) J(x)=0. 

Now this means that writing out (8.1) as a linear system, the deter- 
minant is not zero. Considering the general problem 
(8. 3) f&)=w, L)=y%, f’'E)=" (v= 1,2,..., 0 
this shows that the corresponding linear system is always uniquely solvable 
and Theorem II is proved. 


9. Explicit representation of the interpolatory polynomials. We 
now consider the following problem of (0, 1, 3)-interpolation : 

Given n(= 2k) distinct points §,&,...,§, satisfying (2.3) and arbitrary 

Oy, bg, Og POM Bern CER eens dea Gertns, dat 

we want to find explicit form of the polynomial R,(x) of degree = 3n—1 
such that 
(9. 1) RiEr) = by, Ri(&)=O, Ri (Er)=—d (vy=—1,2,3,..., A) 
The existence and uniqueness has already been proved in Theorem II. For 
convenience we select the numbers &, as n different real x,-zeros 
(9.2) —1 = Xn < Xn-1 <9 << <1 = 
of the polynomial sr,,(x). 
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For Ro.(x) we evidently have the form 
2k 2k 2k 
(9. 3) Rox (x) = Pa by r(x) + D> crvr(x)+ > dywr(x) 
v= v=1 re | 


where the polynomials u,(x), v,(x), w,(x), the fundamental polynomials of 
the first, second and third kind of the (0, 1, 3)-interpolation belonging to the 
x;-points, respectively, are polynomials of degree = 3n—1—6k—1, uniquely 
determined by the following requirements : 


; 1 i a Vv , We 
(9. 4) i,(X;) = 0 for ‘ Ly? u;,(x;) = 0, (x;) = 
’ = , 4 ies | 1 j= i vif! 
(9.5) ty (x) 50, 51x) = f for J ee) 
a , EN 5 str ines 1 J= Ie 
(9. 6) ws(X%) =0, weg) =0, We" (x) = sf 0 pe 


respectively, where /= 1, 2,...,2. In what follows we shall explicitly deter- 
mine these fundamental polynomials u,(x), v,(x), w(x). 


10. We shall denote by /,(x) the fundamental polynomials of the Lag- 
range interpolation, i.e. 


(10. 1) bf) area) 


We shall make use of an observation of FEJER that 


(10. 2) L(y) =0 (y= 2; 3,...,n—1); 
Further we have 

1 j=v 
(10. 3) L(x) = 0 for je es fs Br Peg} 


We shall also require the following results which are easy to verify: 
(10.4) (I—f)(t— x) Y°O+20—P) LO + a(a—1) t—%») b O = 0, 
(10.5) Uy (xj) = —21(x))/ (xj —%), 

’ —n(n—1) PY fel _ 1)" n(n—1) 


wiy=(-E+ das) FAN 


Xy 
po.7) ”4 n(n—1)),, 
w—— (2 2 Pern, 
(10.8) mt! (%) =— “SS 1) 0, (%) 
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(iy eae 


1—x 


(10.9) k= | 


(10. 10) W-)=—aaaeey eT 


11. THEOREM IV. The fundamental polynomials u,(x), vy(x), W,(x) are 
given by the following: 


(a) 
(11.1) iC) = gee |i +5 + Pr- 1}, 
(11. 2) meer ests thy 


and for 2=v=en—1 


Phe Qen(X) * Pi. 0 
0) Sqr EDP, 1 oa 


aE ae) cas 


ra of 1) at}; 


ia 7 ) tx 


(11E3) — P(x) 


(b) 
(11.4) (x)= ae {1r1(x) + e120 (x) +04 Qbn(x)} 
where 
1 2 
(liso) «35 (!—aa-=ph 
r 1 
(11.6) a=— 32n(n—1) 
and 
(11.7) n= 2% fay — 5 nent 
; 5 

“ie eam at +5 Pras), 

(11.8) v(x) = AOD 17, (2) + ex 700(x) +04 Qn (0)} 


n(n) 
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where 
1 2 
(11.9) = a5 (I—agoy), 
7. 1 
(11. 10) = S5nii—1) 
and 
Tn n n(X) + 
ida 11) 


+(B+aacn 70, (x) i Paei(X)ts 


and for 2=¥=n—1 


(11. 12) 1) = |r) 4+ SR 2 er(3) +6774) +6,Qu()| 


7m (Xy) 3(1—x;) 
where 
1 
(11. 13)  6n(n—1)\(1— x2) Paalx,)’ 
| oa u cee ere 
(11.14) 7 ~ enn 112) Poe)’ 
, ) I(t 
ro) = 6G) + J att 
(11. 15) 
AD). gp 4 ee @) 
A fee as 3(1—x;) Pn-1(x») 
and x 
EAA Ce Gate Pri) gy 4 
Cr) = 81) Peale) gal ag 
(11. 16) 


x 1 
+(1 0G) [ee dt + 2P,-1(x) |—x+ geet 
=i 


(c) and lastly for 2S v=n—1 we have 


(x) (x) 
(11.17) a(x) = A,wy(x) + By wi (x) + Crwa() + 6 () + LE wee (x) 


where w,(x), Wi(x), Wa(x) are polynomials each of degree =3n—1, given 
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by (11.3), (11.1) and (11.2), respectively, and 


areee a Ce cit) aa 
A,y=—4l'(x,), B= (x) (1—x)* 
(11.18) _ 2a*(~n—1)4 
"(LA xe) 708%) 
u(x) = BG) + FEF fhe) (a) — 1041+ 
ieee + Aiwi(x) + Biwn(x) 
where ) 
A, = — 2G) (20° —17 0? + 182 +8), 
B, = 22) (25 nt—50n° + 35.0? —10n—48), 
wy C= BOD+ EO y Uo) A) —106(—1) oN + 
11. 
; + Anwi(x) + Bn Wn (x) 
where 


A.=— 20) (a5 nt — 50n* + 35n?—10n— 48), 


B, = ACY (20817? + 182+ 8). 


12. In order to prove part (a) of the above theorem, we observe that 
in view of conditions (9.6) we take 
W1 (x) = € Qn (X) (C1 + Pr-i(x)) 
which is of degree =3n—1, so that it only remains to verify that 
wi’’(x;))=0 for j= 2,3,...,2—1. This is easily done in virtue of (7. 10), 
(7.8a) and (7.6). In order to determine c and c,, we use the requirement 
wi’(1)=1, wi’(—1)=0 
which gives on simplification 
wi’ (1) = 3cn®(n— 1)°(2-++.¢,) = = | 


wi’ (— 1) = 3cn®(n—1)3(2—c:)=0 . 
whence we get (11.1) 
Similarly we get (11.2). For obtaining (11.3) for 2= vy =n—1, we put 


and 


Wy (X) = C1 Qon (x) [F2@ dt + CoPr1(x)+ Cs | é 
1 
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The conditions 
Wy(x;) = W5(x%)=0 for j/=1,2,...,2 


are already seen to be true. Also 
wh (x)=0 for sr. 


But from w;’(x,)=1 and w,’(+ 1)= w;’(—1)=0, weare able to determine 
C1, C2, C3, Viz., 
Wy {Xy) = 301 Q3n(Xy) Pr-1(x,) = 1, 


1 
wy? (1) = eo co iz cs [ne dt—0, 
a 


att 1 
Wy Aad) ee Caetano 


Solving these, we get (11.3) for 2=vSn—1. 
13. In order to obtain part (b) of TheoremIV, we require the polyno- 


mials r,(x) and @,(x) obtained by P. TURAN and J. BALAzs for (0, 2)-inter- 
polation for v—1,2,...,n, where we have 


wpe) j=y 
(13. 1) AD) gaily py, | G1 2) 
ry (%) =0 
and 
0y(x;) = 0, 
(13.2) e(x)—|° for Ja? (j= 1; 2, .-., 0): 
'] j=y 
We now determine v,(x) of degree = 3n—1 for 2=yv=a—1 in the form 
v(x) = 8D E(x) + 606(x) +6 2t0(2) +04 Bul] 


10, (Xy) 
It is easy to check from (13.1) and (13.2) that 
vy(x;)=0 for j=—1,2,...,” 


; 0 iY, 
Vy(X;) = 1 for ‘sis 


and . 


Also from (13.1), (13.2), (7.10) and (7.8) | 
| vy’(x) =O for jv (j/=2,3,...,2—1), 
and w,’(x,)=0 gives 

1 zn" (x,) 1 n(a—1) 


(OS a eS 9° 
Rea) eee 


8 Acta Mathematica IX/3—4 
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Now the two conditions v;/’(+1)—0O furnish the two linear equations 
r,(1) + c0,(1)—2n(n— 1)c, + 8n?(n— 1)?c; = 0 


d 
+ r,(—1)+c0;(—1) + 2n(a—1)c,+ 82? (n—1)?c;. = 0 
whence 1) 
| wie Ise oe nm n(n , G2) ey 
oe wy |e re} + 5 EP tei) er(—0)] 
aug 1 1 n(n—1) 
pas eee a Je peat Di] 
Co eae aye [UH +) + a te() +e) 
From (11.15) and (11.16) we get after re 
EGAN ue 1 Byes 
= 08) Pe) 14 ) 
and ; 
enDer AESIVERRI ‘i Sal tae ) 


(1) ee ae eae eee 
0% ( 1) “PRT SERENE a Ruy | 


for 2=v =n—1. Hence we get the formula (11. 12). 
In order to obtain v(x), we take 


0108) = (r(x) + evzra(a) +64 Qu(0)} 
Clearly, 
0 Dae We he ney 


11(x;))=0 for j=—1,2,...,0; and u(x) = 1 for ora 


Also vi’’(xj) = 0 for j = 2, 3,...,n—1, while vj’’(+1)=0 help us to determine 
c, and cj. 
Indeed, we get 


16 cj n?(a—1)? = —ri(1) ri (—1) — ChyG=?) 
and 


4c,n(n—1) = — ri(—1) + n(1) + 
From (11.7) we can easily get 


(n + 1) (n—2) 
12 


(I) =p ee) = ie), 


Hence we get (11. 4). 
Similarly one obtains the formula (11.8). 
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14. The explicit representation of u,(x) and its determination gave us 
the greatest trouble. In order to prove (11. 17), we start with the forms 
(11.17) with A, B, C still to be determined. 

Obviously, 

oat) LEER (ME On 4 
un) =| for ree (J ame 152, 790): 
Also u,(x;))=0 (j=1,2,...,n). Further from (10.2), (10.3) we get for 
J+-yv and 2=vsn—1 
aa —_ , i) ; : 2 70 (X;) L(x) |- 
7 (3) = 34.@)|20 (x;)— SAGE Lee = (), 
For j/ =v, we see from u;/’(x,)=0 that 


4n(n—1)x, 
C=) 
From the requirement that u;’’(+1)—0 we get 


A= —Al;’ (x,) = 


. m1) 1. 37m) YC) _ 9 
FSS Bk Michie coytle (cleat 
and | " ye (—1)(—1) 
rs We(— 1) (—1) | 3 7k(—1)8 = 1)" 
Seietied—al)clireare rey 70n(Xy) 


These on simplification with the help of (10.4) to (10. 10) yield the required 
results. . vas: 
The explicit forms of u:(x) and u,(x) are obtained in a similar manner. 


The following computations have helped to simplify some formulae: 
yee Eye, 
ray — SPEED ga, y= 2 BETD ny, 
H(i) — CF) pe, Heya ED 16), 
n-y=S, n(—) = 29, 
pena 2 Pet Kn, B(—1) = — COED, 
i’ (—1) CDE (0), p(y — SET 1). 


(Received 25 June 1958) 
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UBER DIE GEODATISCHEN ABBILDUNGEN 
VON RIEMANNSCHEN RAUMEN AUF PROJEKTIV- 
SYMMETRISCHE RIEMANNSCHE RAUME 


Von 
GY. SOOS (Debrecen) 
(Vorgelegt von O. Varaa) 


Prof. Dr. O. Varca anldflich seines 50-ten Geburtstages gewidmet 


Ein n-dimensionaler Riemannscher Raum V” wird projektiv- symmetrisch 
genannt, falls der Weylsche coll Kriimmungstensor 


Win = Rix — — (5; Rij — 0} Rix) 
der Bedingung 
(0. 1) Wie = 0 
gentigt. Man sieht leicht, daB die Riemannschen Réume konstanter Kriim- 
mung, ferner die im Cartanschen Sinne symmetrischen Riemannschen Raume 
(Rijxu =0) zur Klasse der projektiv-symmetrischen Raume gehéren. 

In dieser Arbeit beschaftigen wir uns mit den (von der Identitaét ver- 
schiedenen) geodatischen Abbildungen eines beliebigen Riemannschen Raumes 
auf projektiv-symmetrische Raéume, und zeigen, daB ein V", der auf einen 
projektiv-symmetrischen V" geodatisch abbildbar ist, notwendig ein Raum 
konstanter Kriimmung sein mu. Diese Behauptung bildet eine wesentliche 
Verscharfung eines Satzes von N. S. Sinjukow [1], der die obige Behauptung 
im Falle von in Cartanschem Sinne symmetrischen Raumen bewiesen hat. 

Im folgenden stellen wir die aus der Bedingung (0. 1).herleitbaren 
Konsequenzen zusammen. 


1. Projektiv-symmetrische Riemannsche R&aume 
Man-bekommt aus (0. 1) leicht die Relationen 
—2 
Wixin = <= (Rix); — Rix) = 9, 


d.h. es folgt, falls n= 2 ist, 
(1. 1) Rx jj; — Ri = 9. 
Da andererseits 
Re\j— ig|k = — Wiggin 
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ist, haben wir auch 


(1. 2) Rix, =. 
Aus (1. 2) folgt 
(1. 3) Rijx\ntm a= (). 
Es wird gezeigt, daB auch die Relationen 
(1. 4) ———— Ririmjn=0 


giiltig sind. Dazu brauchen wir folgendes Lemma von A. G. WALKER [2]: 
Es gilt in einem Riemannschen Raum die Identitat: 
Raijeitym — Raige|mjt + Rirtm|nji— Rjrerm|ijn + Remnil jk — Rimnija| js = 0. 
Zieht man nun den Index A herauf, und verjiingt nach A und /, so 
entstehen aus der obigen Identitét die Relationen: 
Reutnjm — ulmin + Rogkinli— mjk\i|h — Reim| jj + Rim|x|j; = 0. 
Wegen (1. 3) folgt 


(125) Rimini j — Rim| je — Rijeimir — Rinjx|ijn = O. 
Wir betrachten nun die Gleichungen 
Wi ik|mja = O 
ijk|l|m — ijk|m|l —— VU. 


Diese lauten, wenn man nach A und / verjiingt, 
1 ; 
(1. 6) FT (Rist — Riis) — (Resiaim — Rij) — Rojee = 0. 


Wegen (1.1) verschwindet der in Klammer stehende Ausdruck. Ver- 
wendet man dieselben Relationen auf die beiden ersten Glieder, so erhalten — 
wir aus den vorangehenden Gaia 


(Te 7) Rijxjmjn = ———+- (Rimisp Rimi) 


Setzt man dies und den dhnlichen Ausdruck fiir Ry jx, in (1.5) ein, so 
ergibt sich 


1 
at z CRimisjs— Rimini) = 0, 


also ist 
(1. 8) Rim|,jk — Rim|x| ; = 0. 


Unter Beachtung von (1.6) und (1.7) stellt man die Richtigkeit der 
Behauptung (1. 4) fest. 


Endlich gelten wegen (1.3) und (1.4) die Gleichungen 
fig (Rsijxjnjm — vijhe|m|n) — 0, 
oder nach einer Umformung 
(1. 9) O" (Rbistle1m — Roigrjmir) = 0. 
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2. Formulierung und Beweis des Hauptsatzes 


SATZ 1. Ist ein Riemannscher Raum V" (n>2) auf einen projektiv- 
symmetrischen Riemannschen Raum geodatisch abbildbar, so ist V" von kon- 
Stanter Kriimmung. 


Bewels. Es seien V" und V" Riemannsche Raume, ferner sei V” pro- 
jektiv-symmetrisch. Es wird vorausgesetzt, daB V" auf V" geodatisch abbild- 


bar ist. Da V" projektiv-symmetrisch ist, folgt das Bestehen von (1. 9): 
2p (Roixjrim — Ryijn|m|t) = 0 

oder 
(2. 1) J ged (Rysix Rim + Roisr Rim + Roijs Rim» — Rip: Ries — 0. 

Diese Gleichungen bilden, zusammen mit den in unserem Falle nach 
(1.7) auch geltenden Gleichungen 
(2. 2) Rim| jx — Rima ==), 
die einzigen Relationen, mit deren Hilfe N.S. Sinjukow die Richtigkeit des 
Satzes, falls V, symmetrisch ist, beweist. Damit ist der Beweis auf die 
Aussage eines schon bewiesenen Satzes zuriickgefiihrt. Fiir die Einzelheiten 
des Beweises verweisen wir auf die zitierte Arbeit. 

Nach einem bekannten Satz von BELTRAMI kann man Riemannsche 
Raume konstanter Kriimmung nur auf Raume mit derselben Eigenschaft geo- 


datisch abbilden. Daraus folgt 

Satz 2. Es ist unméglich, Riemannsche Rdéume V"(n>2) auf vom 
Raum konstanter Kriimmung verschiedene projektiv-symmetrische Radume geo- 
datisch abzubilden. 
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BEMERKUNGEN ZUR HERMITE—FEJERSCHEN 
INTERPOLATIONSTHEORIE 


Von 
J. BALAZS (Budapest) 
(Vorgelegt von P. TurAn) 


§ 1. Einleitung 


1. Es sei f(x) eine im Intervall [—1, + 1] definierte Funktion und 
(1.1. 1) + 128i > Son >>> > En S—1 (t= 1,2, secant) 
.ein Punktsystem in demselben Intervall, dann ist 


(1. 1.2) Hf; x) = DHEn)hon(2) ie a BES pt ERS a 


die zur Funktion f(x) gehérende und am Punktsystem (1.1.1) definierte 
Hermite—Fejérsche Interpolationsfolge. Die im Ausdruck (1.1.2) enthaltenen 
{a,,} sind vorgeschriebene Zahlenwerte, 


faie3) hiya(x) = v,.(x)L.(x) 
sind die Grundpolynome erster Art und 
(1 . 1 . 4) Hn (x) a (X—Eyn) | Pee (xy; 
die Grundpolynome zweiter Art, wobei 
@» (Xx) 
19025) la(X) = TE Nee): E.)(x—E,) 
und 
(1. 1. 6) @n(X) = C(x — Ein) (X —Son)+ + (X—Enn) (c = konstant + 0), 
sowie 
F 3 gat On (Evn) nt 
(1. Is 7) Yon (xX) = 1 ,(Evn ) (x 0) 


bedeutet. Aus der Definition von H,(f; x) folgt, daB es ein Bee hdch- 
stens (2n—1)-ten Grades ist, wofiir 
cl. ie 8) AA En) ==f(E,,) und - AGE X)}e=e,,, = Ayn 


besteht. 
Es sei 7t2n-1(x) ein Polynom héchstens (2n—1)-ten Grades, dann ist, 


wie bekannt, 


(1 ahd 9) >" tina Sen) hyn(X) + Dat. 1(Eyn) Han (x) = 702n- 1(x) 


v= 


I 
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und fiir den Spezialfall von 7t2,-1(x)=1 


(1. 1. 10) & hn(x)=1. 


2. Die Untersuchungen der Interpolationsfolge {H,,(f;x)} beziiglich ihrer 
Konvergenz wurden von L. FejéR ([1], [2], [3], [4], [5]) begonnen. Das Kon- 
vergenzproblem der Folge {H,(f;x)} mit den Wurzeln der zur Gewichts- 
funktion w(x) =(1—x)*(1 +x)’ gehdrenden orthogonalen, sogenannten Jacobi-. 
schen Polynome als Grundpunktsystem wurde fiir den allgemeinen Fall, also 
fiir jeden Parameterwert « >—1,@>—1 von G. SzeGo [9] und S. SHOHAT [8] 
geklart. .Aus ihren Untersuchungen ging hervor, daf aus der Voraussetzung 
der Stetigkeit von f(x) im abgeschlossenen Intervall [—1, +1] und aus 
fatm\ = {f" (Em)}, |f’ (Emn)|<A die gleichmaBige Konvergenz von H,,(f; x) gegen 
F(x) im Intervall [—1+¢, + 1—e] folgt; fiir @<O ist die Konvergenz auch 
im Intervall [—1+.¢, +1] gleichmafig, fiir @=0 ist jedoch {H,(/;x)} im 
Punkt x +1 — wo also die Gewichtsfunktion bei e>0 gleich Null ist — 
im allgemeinen divergent. 

G. FREUD [6] beschaftigte sich mit der Konvergenz der Folge {H,,(/; x)}, 
wenn das Grundpunktsystem aus den Wurzeln der zu einer beliebigen nicht- 
negativen Gewichtsfunktion w(x) gehdrenden orthogonalen Polynome 
{w,(x)} besteht. Seine Konvergenzsatze enthalten die Voraussetzung, dai die 
Gewichtsfunktion w(x) im ganzen Intervall [—1, + 1] entschieden positiv ist. 
Prof. P. TURAN hat nun die folgende Frage gestellt: Gibt es im Intervall 
[—1, +1] ein orthogonales Polynomsystem {@,(x)}, dessen Gewichtsfunktion 
an einer inneren Stelle dieses Intervalles gleich Null ist, wahrend die Folge 
{H,(f; x)} im abgeschlossenen Intervall [—1, + 1] gleichmaBig gegen die Funk- 
tion f(x) konvergiert, wenn die Wurzeln von {@,(x)} zum Grundpunktsystem 
gewahlt werden und von der Funktion nur die Stetigkeit, von den {an} die 
Beschranktheit vorausgesetzt wird? Auf diese Frage geben wir im Satz | 
dieser Arbeit eine bejahende Antwort. 

L. FEJER nannte das Grundpunktsystem von (1.1.1) normal, wenn im 
Interpolationsintervall —l=x=+1 


(Trot) Ym(x)=0™ (vy —1,2,,..5.2; n=1,2,3,, oe 


besteht, und streng normal, wenn 
(1.2; 2) Vin(x) =e >0 (ve=01, 2, yyy Neel, 2,50 


besteht, wobei vn(x) die lineare Funktion (1.1.7) bezeichnet. Bezeichne X)» 
die Nullstelle von v(x), so besteht wegen (1. 1. 7) 


Br aS (es On (Sn) 
( ) X, n Een + On (Eyn) ‘ 
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L. FEJER hat die Nullstelle X,, als konjugierten Punkt bezeichnet. Aus (1. 2. 1) 
und (1.2.2) folgt offensichtlich, da® keiner der konjugierten Punkte im Inneren 
des Intervalls (—1, +1) liegt, wenn das Grundpunktsystem (1.1.1) normal 
ist, bzw. alle konjugierten Punkte auferhalb des Intervalls [—1, + 1] liegen, 
wenn das Grundpunktsystem streng normal ist. 

Den Untersuchungen von FEjJER anschlieBend hat G. GRUNWALD [7] 
folgendes gezeigt: liegt keiner der zum Grundpunktsystem (1.1.1) gehérenden 
konjugierten Punkte im Inneren des Intervalls (—1, +1), d.h. ist das Punkt- 
system normal, so konvergiert {H,,(f;x)} in jedem beliebigen inneren Teil- 
intervall des Intervalls (—1, +1) gleichmaBig gegen die im abgeschlossenen 
Intervall [—1, +1] stetige Funktion f(x), wenn die Zahlenwerte {e,,} be- 
schrankt sind. Befindet sich jedoch jeder konjugierte Punkt des Grundpunkt- 
systems auBerhalb des Intervalls [—1, +1], d.h. ist das Grundpunktsystem 
streng normal, so ist die Konvergenz im abgeschlossenen Intervall [—1, +--1] 
gleichmaBig; es geniigt sogar, statt der Beschranktheit der Zahlen {e,,,} die 
Ungleichheit |@,,|<cne®-* anzunehmen, wobei c eine von n unabhangige Kon- 
stante bedeutet und 9>«>0 ist. Im Zusammenhang mit den Gesagten hat 
ebenfalls Prof. P. TURAN die folgende Frage erwahnt: Kann im Intervall 
[—1, +1] ein Grundpunktsystem angegeben werden, dessen konjugierte Punkte 
(1.2.3) im Intervall [—1, +1] tiberall dicht sind, und die zu diesem Grund- 
punktsystem gehdrende Interpolationsfolge {H,(f;x)} im abgeschlossenen 
Intervall [—1, +1] trotzdem gleichmaBig gegen die Funktion f(x) konver- 
giert, wenn nur die Stetigkeit der Funktion f(x) im Intervall [—1, +1] und 
die Beschranktheit der Zahlen {a,,,} angenommen wird? Mit dem Beweis des 
Satzes II dieser Arbeit bejahen wir auch diese Frage. 


Die zu beweisenden Satze sind die folgenden: 

Satz I. Die auf das Grundpunktsystem 
(1. 2. 4) Sie titigaon akan ES ee) 
beruhende Interpolationsfolge {H,(f;x)}, wo (1.2.4) die Wurzeln des zur 
Gewichtsfunktion 
(1.2.5) p(x) =(1— x?) 2 |x PA [-4<n<0} 


gehérenden orthogonalen Polynomsystems {p,(x)} bezeichnen, konvergiert im 
abgeschlossenen Intervall [—1, +1] gleichmapig gegen die in diesem Intervall 
stetige Funktion f(x), wenn |@,n|=c,n°, | tlle dt besteht und c, eine von n 
unabhdngige Konstante ist.’ 


1 Im weiteren werden c, ((=1,2,3,...) immer von n unabhangige Konstanten be- 
zeichnen. 
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Satz Il. Die zum Interpolationsgrundpunktsystem (1.2.4) gehérenden 
konjugierten Punkte 


Dn(Xvn) 5 aie 
Xon = Xn ~ y=1,2,..\,23 4==1, 2, oe 
(1. 2. 6) Xeon + Di Xn) ( 


liegen iiberall dicht im Intervall [—1, + 1). 


Aus (1.2.5) folgt p(0)—0, also ist die Gewichtsfunktion an einer Stelle 
im Inneren des Intervalls [—1, +1] tatsachlich gleich Null. 


§ 2. Bei den Beweisfiihrungen angewandte Resultate 
1. Die im Intervall [—1, +1] zur Gewichtsfunktion p(t) —=(1—??)* ge- 


hdrenden orthogonalen Jacobischen Polynome y(t) = P(t) (n=O, 1, 2,...), 
die sogenannten ultraspharischen Polynome, geniigen der Differentialgleichung* 


(2. 1. 1) (i1—?’)y” —2(a+ 1)ty +n(n4+2a+1)y=0 
fiir @>—1. Das Polynom Py,(t) ist derart normiert, dab 
(2.1.2) P21) = (Fees) 


Es besteht die folgende Gleichung :* 
(2. 1. 3) P(t) = (—1)" P(— 2). 


Wir werden von den folgenden Formeln Gebrauch machen :* 


(2. 1. 4) _max Peoi—("*"], wenn e=—s, 
sowie° et, 
(2.1.5) S{P2()} = (m+ 20+ 1) PE (t). 


Bezeichne t, cos, eine Wurzel des Polynoms P,,’(t) = P (cos 9), so gilt 


fir — > Sa=+ > die Brunssche Ungleichung* 


1) 2 _ > Seed 4.3 on m 
(2. 1. 6) (4) =9 <7 3 (»>—1,2,...,[4]}. 


2 Siehe z. B. G. Szead, Orthogonal polynomials, Amer. Math. Soc. Coll. Publ. (New 
York, 1939), S. 59, Formel (4. 2. 1). 


8 Siehe 2, S. 58, Formel (4. 1. 3). 

4 Siehe 2, S. 163, Formel (7. 32. 2). 
5 Siehe 2, S. 62, Formel (4. 21. 7). 
® Siehe 2, S. 118, Forme! (6. 21: 7). 
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Eine ahnliche Ungleichung gilt fiir die negativen Wurzeln wegen d 
(2. 1.3) folgenden Gleichung t, + tnii-, =O. : pie 
Fiir den Differentialquotienten von P(t) nach ¢ besteht fir ae>—1 
die folgende Ungleichung :’ 
; ’ apes 9 
(2. 1. 7) Px? (cos f,)|=av  2m*” (o<9,=). 
2. Im folgenden bestimmen wir die zur Gewichtsfunktion (1.2.5) geho- 
renden und im Intervall [—1, +1] ein orthogonales System bildenden Poly- 
nome {p,(x)}. Diese sind die folgenden :° 


2.1 ee PH(VI—x) ~—s fir = n= 2k, 
‘e iq xPH)(V1—s4) far n=2k+1 
wobei dureh die Substitution /1— x? =¢, Px? (t) bzw. P&*(t) die im Intervall 


—1<t=+1 zu den Gewichtsfunktionen (1—?*)* bzw. (1—?*)“*" gehdrenden 
orthogonalen, ultrasphdrischen Polynome von geradem Grade _ bezeichnen, 


(n =0, 1, 2,...), 


; 1 F ' ; 
wobei =a <<0 ist. Die Ausdriicke in (2.2.1) sind offensichtlich wegen 


(2. 1.3) Polynome. 

Es laBt sich leicht zeigen, daB die Polynome in (2.2.1) im Intervall 
—l=x=+1 ein zur Gewichtsfunktion (1.2.5) orthogonales System bilden. 
Und zwar erhalt man mit Riicksicht darauf, daB die Polynome P(t) bzw. 

s+) (¢) zu den Gewichtsfunktionen (1—?*)" bzw. (1—?*)"** gehdrende ortho- 
gonale Systeme bilden und (1.2.5) eine gerade Funktion ist, durch die Sub- 


stitution t=) 1— x’ wegen (2. 1.3) 
1 1 
- | pox(e)pa(e)p(a)dx = 2 | poa(x)pu(e)P(a)dx = - 
-1 0 


1 
=0 fir k= / 
Sel (14) 4) 4y 7.1 #2)" gt — é a 
—2| pt (QPP OHA dt= bu) 4 9 far pap = 94 2,.-), 
0 


sowie auf ahnliche Weise 
1 


1 
=0 firk= 1, 

[ess (x) pars (x) p(x)dx = g PS (1) PS? (1-0) dt = bu +0 ftir oe l 
1 


7 Siehe 2, S. 232, Formel (8. 9. 2). 

8 Die zur Gewichtsfunktion (1—x?)”|x|* (p >—1,q>—1) gehdrenden orthogonalen 
Polynome wurden durch K. V. Lascenov bestimmt. Siehe K. V. LaSéenov, On a class of 
orthogonal polynomials (russisch), Leningrad, Gos. Ped. Uc. Zap., 89 (1953), S. 167—189. 
Die Polynome in (2.2.1) unterscheiden sich nur durch konstante Faktoren von densdurch 


1 
K. V. LaSéenov bestimmten orthogonalen Polynomen fiir ery und g=2s« +1, 
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und 
| po (x) pois1(x)p(x)dx = 0, 
-Y 


da die zu integrierende Funktion, wie aus (2.2.1) und (2. 1.3) sofort ersicht- 
lich, ungerade ist. Also bildet {p,(x)} im Intervall [—1, +1] tatsdchlich ein 
zur Gewichtsfunktion p(x) in (1.2.5) gehérendes orthogonales Polynomsystem. 
Daraus folgt nun, daB die Punkte xin, Xon,...,Xnn in (1.2. 4) alle verschieden 
sind und im Inneren des Intervalls [—1, +1] liegen. Wir betrachten diese 
Wurzelstellen in folgender Reihenfolge : 


(2.2.2) —1< Xnt1,n<Xng9,.n<0°*< Xun <O< Xin< Xan < Ste oS 
fiir n=2k- 
und 
(23250) —1< Xn492,n< Xn43, n<09*< Xun <O = Xp, n< Xin <Xon<+°+<Xen< +1 
fiir n=2k+1. 


Aus der Reihenfolge von (2.2.2) und (2.2.3) folgt offensichtlich wegen 
(2.2.1) und (2. 1.3) 


(2.2.4) pee (y=1,2,... |3). 
Wir werden beziiglich der Wurzelstellen des Polynoms p,(x) von folgender 
Abschatzung Gebrauch machen: 


HILFSSATZ 2.1. Bezeichne Xyn (v=1,2,...,n; n=1,2,...) die Wurzeln 
der Polynome p,(x) in der Reihenfolge (2.2.2) bzw., (2.2.3), so ist fiir 


| 1—x?, a ton = COS ug [» 3 : Dy ts SH) 


2 
Ll]. 76? 
(2. 2. 5) In>(y—4)2 = 5”. 


BEweEIs. Fir den Fall n = 2k+ 1 seien Ty, 2x41 = COS Py, 2x41 DZW. ty, 2441 = 
=cos A, %41 die Wurzel- bzw. relativen Maximumstellen des Polynoms 
P$O,(t). Wegen (2.1. 5) ist jedoch die relative Maximumstelle t,, 41 —= 
= cos F,,ox41 eine Wurzel des Polynoms Px‘ (t), daher gilt wegen (2.2.1) 
und (2. 2. 3) 

t,, 2k+] == COS Son SS Vi—x2, 


fiir jeden von k+1 verschiedenen Wert von v. Da, wie. bekannt, 
O< G1, 2741 < Po, x41 <0 < P2k+1, +1 < WH 

ist, folgt aus dem Satz von ROLLE 

(2. 2. 6) Pv, KH <A y, 2441 < Py st, M44 » 
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und da —2 <y<0 gilt, erhalt man wegen (2.2.6) und (2.1.6) die Un- 


gleichung (2.2.5) fiir den Fall n= 2k+ 1. 
Ist n= 2k, so ergibt sich, da — e <u<0, wegen (2. 2. 2), (2.2.1) und 
(2.1.6) direkt die Ungleichung (2. 2.5). 


FOLGERUNG. Fiir die Wurzeln x,, der in (2.2.1) definierten Polynome 
Px(x) gilt die folgende Ungleichung : 


(2.2.7) Sal lmreal>&  (y—t,2,...,/4]), 


Ist namlich ty = /1—x2, cos Pn, so ist wegen (2.2.2), (2. 2.3) und 
(2. 2.4) offensichtlich 


Xen} eae \Xati-», n| = sin me = 2 Pon (>= ie 2, See Ei 


und daraus folgt schon (2.2.7) wegen (2. 2.5). 
Wir werden weiterhin folgende Abschdtzungen der Polynome p,(x) 
(2. 2.1) gebrauchen: 


HILFSSATZ 2.2. Im Intervall —1Sx=+1 (n=1,2,...) besteht 
(2. 2. 8) | Pn(x)| Sc,n". 

BEweEls. Die Ungleichung (2.2.8) kann fiir den Fall n= 2k sofort ein- 
gesehen werden. Es ist namlich ie (ees und —+ <u<0O, sowie 
wegen (2.2.1) und (2.1.4) 

max. |Pa(x)| = Gar : ) S05(2k)". 


Ist dagegen n= 2k-+1, so erhalt man durch die Substitution t= /1—? 
mit Riicksicht auf (2.2.1) und (2. 1.5) 


P21 (x)= = % y1 ote PE?) = ia moti eel yi— Oi os) PS1(t)}- 


Hieraus folgt jedoch durch Anwendung der Bernsteinschen Ungleichung fiir 
Polynome wegen (2. 1.4) 
2k+1 (2k+1 re) I 
pena 2k+1 =c,2k+1). 
2.6. i. 
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§ 3. Eine Abschatzung beziiglich der Grundpolynome erster Art 


1. Bezeichne x,, eine Wurzel des Polynoms p,(x), so folgt wegen 
(2.2.1) durch Differenzieren nach x fir n=2k 


inl? s(t) : 


Pu (Xn) __ Xm ' 
Xon(1 —Xn) 


Dn (Xn) Vi—x;, I—X} dt (PPO) 


(3.1. 1) 
t=)1-23,, 
Durch die Substitution /1—x?, —+¢,, erhalt man dagegen wegen (2.1. 1) 


gnlPs PO) _— 2+1)tn _ 2+) /1I—-%,, I) V1 =n ; 
< ieee aoe 
FPPON) 
dies setzen wir in (3.1.1) ein: 
Di(Xmn) a Xyn etl Xin(1-—Xpu) 
Ist dagegen n=2k+1 und r=+-k+1, so ist wegen (2.2.3) und (2.2.1) 
a) 
{3 ihe 3) Dn Dn (Xyn) BS) ie Xyn dt? ‘2 as 25-30. 
Dr (Xen) Xyn V1—x?,, d ppye t Xiu 1 — Xoo 
at r ( y) t=) 1-22, 


Durch die Substitution /1—x?2, —t,, erhalt man wegen (2. 1. 1) 


@ (u+1) 
aelPero| us Seay (tm) __ 2(¢@-+2)tom _ 2u+2)/I—X, 
4 [PEP] | . TPH ts) 1—t,, Xs 


und dies in Ap 1.3) einsetzend 


Pi(Xm) Xan Xyn kA(1— 20) af Xy, (1—x>n) 
In dem Fall y=k-+1 ist wegen (2.2.3) Xm—=Xxi1,n=0; da jedoch auch 
das Polynom p;/(x) eine ungerade Funktion ist, besteht -p/’(xi41,n) =O und 
es ist in diesem Fall 
Dn (Xk-+1, 4) 


3.1.5 ot wid etal Dis Idea 
eee pany we 
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2. Nun kénnen wir zur Abschatzung der Summe der absoluten Werte 
der Grundpolynome erster Art iibergehen. Es gilt der folgende 


HILFSSATZ 3.1. /m Intervall —1=x=+1 besteht fiir das Grundpunkt- 
system (1.2.4) 
(3. 2. 1) BS | ton (x)| S Cro. 

BewEls. Aus (1.1.7), (3.1.2) bzw. (3.1.4) folgt 
(3.2.2) tm) —1— AE DGD (es, fiir Xm-E0; 


ist dagegen im Fall n=2k+1, v=k-+1, dh. ist wegen (2. 2.3) xiu1,, 0, 
so folgt aus (1.1.7) und (3.1.5) 


3. 2. 3) Ur+1, n(X) =1. 

Aus (3.2.2) ergibt sich fiir x—0O wegen der Ungleichungen — > <u<0 
und |Xn|<1 : 

(3. 2. 4) tmn(0) = 1 + EEC DT = 2|u|>0. 


Diese Ungleichung ist wegen (3. 2. 3) auch fiir n= 2k-+ 1 und y—k+ 1 giiltig. 
Im Intervall —1=x=0O ist wegen vyn(X..)—=1 und (3.2.4) fiir x,,<0 

(3. 2. 5) Vyn(X) = 2|u|>0, 

da w»(x) eine lineare Funktion ist. Im Intervall O=x=+1 folgt aus 

Vyn(Xn) = 1 und (3.2.4) fiir x,,.20 ebenfalls 

(3. 2. 6) Vyn(X) 2 2|u|>0. 

Wir beweisen die Ungleichung (3.2.1) im Intervall —1=x=0. In diesem 

Intervall ist fiir x,,=0 wegen (3.2.5) und (1.1.3) A,n(x)=0, also mit Rtick- 

sicht auf (1.1. 10) 


n 


D> ltl) = > + DS DD hte) + D> [fen (X)| = 
(3. 2.7) = BypZ0 Fyn DO0 Hyp Zip, >0 


=1— D An) + D |hon(X)|S1+2 D |hyn(X)]. 
Lyn >0 Lyn —>0 Lyn 0 
Wegen (1.1.3), (3.2.2), sowie (1.1.5) erhalt man 


1 2+ Dm) +1 Px(X)- 


ok [Fon (2)| ee xP Th) Fantin Pi Grn) X— Xn) Z 
(3. 2. 8) : ; - f 
om Pr(x) 2(# +1) Gn—1) +1 Pn(x) 


2 


nt Lyn >0 Dn (x5) (x— Xyn) Lyn 0 Xyn (1 ia Kea) Dr (Xia): | X— Xon | 


9 Acta Mathematica IX/3—4 
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. 2 
Da —1=x<0, 0<xm<1 und —5<n<0, ist |2(u + 1(2.—1) + SI 
und |x—Xyn|>Xm, also auf Grund von (3. 2. 8) 
: 2 
nn x 
DS ina eee 


>0 Tyn>O on (1 — Xn) pi (uals : 


tyn- 


woraus wegen (2. 2. 1) 


| area 

i ate SER 

@.2.9) Psom b —_ 2 _$§_, fiir n—=2k +1 
scotch B (PS (t)} | Bie} 


folgt. Sei ty, = V1—x2, cos, so folgt aus der Ungleichung (3.2.9), 
sowie aus (2.2.8), (2.2.7) und (2.1.7) 


k 2 
Cs SD, ne (2) etsy -e-4 fir a=2k, 
y v=1 Vv 
— | Ayn (x)| = k 
>0 


6 
Sie C; 2, nee ty pnt p-2u-6 fir n=2k+1, 
v=l1 y, 
und da —3<n<0 ist: 
(3. 2. 10) >a |Ayn(X)| SCs. 


Aus (3.2.7) und (3.2.10) ergibt sich (3.2.1) im Intervall —1=x=0O. 
Durch ganz. 4hnliche Beweisfiihrung erhalt man fiir das Intervall 
O=xs+1 


PD iin@) sa. 


Es ist ndmlich im Intervall O=x=1 fiir x,,=0O wegen (3.2.6) und (1.1.3) 
hyn(x)=0, und deshalb besteht, 4hnlich dem Ausdruck von (3. 2. 7), 


Dilton S1+2 DY Iter). 


Diese Abschatzung erfolgt im Intervall O=<x= +1 analog wie die des Aus- 
druckes (3.2.7) im Intervall —1=x=0, bei Beachtung von (2.2.7). Q.e.d. 
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§ 4. Eine Abschatzung beziiglich der Grundpolynome zweiter Art 


1. Aus (1.1.4) und (1.1.5) ergibt sich 
P(x) 
(4. 1. 1) DS | Byn(x)| ce bs [x— Xy ey Du (Xon)?(X—Xyn)” 
Fiir diese Summe gilt die folgende Abschatzung: 


HILFSSATZ 4.1. Jm Intervall —1=x=+1 (n=1, 2,3,...) besteht nebst 
dem Grundpunktsystem (1.2.4) die Abschdtzung 


(4. 1. 2) Pa |bon(x)| S can". 


BEweEls. Wir betrachten das Intervall —1=x=0O und den Ausdruck 


(4. 1.3) Ll5m1—= at ar 


Wegen —1=x<0 ist |\X—Xon| Xen flir ps Gh daraus folgt nach (2. 2.1), 
(2.2.2) und (2. 2. 3) 


BD y P(x) 75 fiir n=2k, 
®y,>0 3 (u) 
> f ' | Xon| Be: Oo, y| 
wnA(X)| S 2 
“i Sepik alee astane a ints dy iste 


Typ» >O 5 if | 
|X| at t=//1-22,, 
Hieraus ergibt sich bei Beachtung von (2.2.8) und (2.2.7), sowie durch die 
Substitution /)1—x2,, == cos #,, wegen (2. 1.7) 


ta > nu (% ) n--4y2e+8 ftir n=2k, 


v=1 


(4.1.4) 2D le@lS) a /, 
nth Co 2,1 (*) per n-e-6 fir n=2k+1. 


Da —t<u<0o ist, gilt wegen (4.1.4) im Intervall —l=x=0 


(4. 1. 5) ay |8»n(Xx)| S csr 


vn 
Es seien nun x,,=0, —1=x=0 und 


41.6 LiOl= 2 + B -V+2” 


n= Fyyp_=0 
|t-2y_|Z nt renter” 
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In Anbetracht von (1.1.4), (3.2.5), (1.1.3) und (3.2.1) gilt im Intervall 
—1sxs0 
. ‘ u Ve 
> lon(x)| <0" >” bx = tal = | Ven (X)|lon(X)? S 
(4.1.7) ’ 
= Bal ay |tn| S¢,n". 
Aus (1.1.4), (1.1.5), (2.2.1), (2.2.8) und (2. 2.7) folgt jedoch wegen (2. 1.7) 
durch die Substitution /1—x2, cos 9,, die Beziehung 


D>" [Bon(x)| Ss n-t Dy” POY = 


Pn (Xn)? 
4 
(4. 1. 8) | Cys >) 2H y2u+8 2H -4 fir n=2k, 
v=l 
= 
= 2 k 
n(x) 2 eo 5 a 2 * s7i4 
[PAOD + enn a Lipahae ns fir n=2k+1. 
Aus (2.2.8), (2.2.1) und (2.1.2) erhalt man fiir n=2k+1 
Pox) = a i na 44 wan ee, 
pry? [Px (DP aa 4 n 
2k 
Hieraus und aus (4.1.8) ergibt sich im Intervall —1=x=0 
(4.1. 9) > |bon(x)| Seen". 


Im Intervall —1=x =O besteht also auf Grund von (4. 1.3), (4. 1.5), (4. 1.6), 
(4.1.7), sowie (4. 1.9) 


X |bon(X)| Sewn". ) 
Auf ganz ahnliche Weise la&t sich im Intervall O=x=1 die Ungleichung 
2 [Bon (x)| S Co 0 


beweisen. Hiermit ist unser Hilfssatz bewiesen. 


§ 5. Beweis von Satz I 
1. Sei f(x) im Intervall —1=x=-+1 stetig. Dann ist 


(5.141) Hi, (f; x) = p> F(X) Aon (x) + P3 Cyn Dyn (X) 


die Hermite—Fejérsche Interpolationspolynomfolge des Grundpunktsystems 
(1.2.4), wobei {en}=c,n> und OXd<|u| ist. Laut des WeierstraBschen 
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Approximationssatzes gibt es ein rationales Polynom r(x) derart, daB im 
Intervall —1=x=-+1 fir e>0 


(5. 1. 2) f(x) —2c(x)| S min (a 4] 


besteht. Ist M= max | (x)|, so lat sich n wegen -+ <<0O und (4,1. 2) 


so groB wahlen, dab i = Intervall —1S=x=+1 


(5.1.3) Pe (Xn) bom (X)} = (M+ cn?) Ds [Bon (x)| => 


gilt. Ist 2 groB genug, so folgt aus (1. 1.9) 


(5. 1. 4) (x)= > IU(Xyn) Aon(x) + Ds 70’ (Xn) Hon (X). 


Nun erhalten wir mit Hilfe von (5.1.1), (5.1.4), (5.1.3), (5.1.2), sowie 
(3.2.1) die Abschatzung 


Ha F52—L2)] SD re) (4) fon 20] + (M+ 6,0" a Ben) + 


+ [-e(2) 00) = max |f(Xm)— (Xen) | C10 + > rts ae 


Hiermit ist Satz I bewiesen. 


§ 6. Beweis von Satz Il 


1. Die zum Grundpunktsystem (1.2.4) gehdérenden konjugierten Punkte 
sind aus (1.2.6), (3.1.2) bzw. (3. 1.4) folgend, fiir x,,=-0: 

Xyn(1—Xon) fa Xyn[(2# + 1) Xn — 2H] 
2(u+ W)(%m—1I) +1 2(H+1)Xm— (2 +1) 


Ist dagegen x,,—0O, d. h. im Fall n=2k+1 mit y—k-+1, so gilt wegen 
(3.1.5) und (1. 2.6) 


(6.1.1) Xm=Xa+ 


Xk-1, COs 


Zum Beweise des Satz II werden wir von folgender Behauptung Gebrauch 
machen : 

Sei (a, @) ein beliebig. kleines, festgehaltenes Teilintervall des Intervalls 
[—1, +1]. Betrachten wir das Grundpunktsystem (1.2.4). Wir beweisen, daB 
fiir ein gentigend groBes n, von diesem n an mindestens ein Glied einer 
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jeden Reihe der dreieckférmigen Matrix des Grundpunktsystems sich im In- 
neren des Intervalls («, @) befindet.° 
ES: sei , 
a0) fit- =e oe 
f(x) =) (x—@)(6—x) fir @SxS8, 
0 fiir B<xs+1; 
f(x) ist im Intervall —1=x=+1 offensichtlich stetig. Nehmen wir an, dafh 
die Behauptung falsch ist. Dann gibt es eine Folge m<a,<-*-<M<-- 
derart, daB kein Glied der zu diesen Indizes gehérenden Punktgruppe 


Xin» XInjy +++) Xnjn, (= 1, 2, 3,...) sich im Inneren des Intervalls (a, @) befindet. 
Hieraus ergibt sich, daf im Intervall —1=x=+1 limH,,(f;x)=O0 gilt. 
Dagegen ist nach Satz 1 an der Stelle xa Stk 


9 


lim A,,(f; n=s( 4) -(4 = 0, 
in Widerspruch zur vorausgehenden Folgerung. 

Also bedecken die Punkte des Punktsystems (1.2.4) das Intervall 
[—1, +1] tiberall dicht. 

Hiernach ist es leicht zu beweisen, daB auch die zum Punktsystem 
(1.2.4) gehérenden konjugierten Punkte (6.1.1) das Intervall [—1, + 1] tiber- 
all dicht bedecken. 

Die zu den Punkten x,,==0 gehdrenden konjugierten Punkte erhalt 
man wegen (6.1.1) aus der Funktion 


x[(2u + 1)x°—2u] 
bay SST 
80) = 2 tDe—Oe +) 
an den Stellen x,,. Im Intervall —1=x=+1 ist g’(x)<0. Daher ist die 


2u+1 ay 1 
Funkt Intervall | — . —. 
unktion g(x) im Intervall y gett +] Qu k2 , welches wegen a< 
<u“<0 ein Teilintervall von [—1, +1] bildet, monoton abnehmend, stetig, 
und ihr Wertbereich umfa&t alle Werte von + co bis —oo. Also muB es zwei. 


voneinander verschiedene Punkte a@ und 6 im Inneren des Intervalls 


2u+1 2u+l 
(—) 2443, +) 3e4h) geben, so dai g(a) = —1 und g(b) —+ 1. Wegen 
& (x)<0 ist —1=g(x)=+1 im Intervall 6=x=a. Es seien y und 0 zwei 


* Diesé Behauptung wurde fiir den Fall eines normalen Punktsystems Xin) Konic epee 
(n =1,2,...) von L. Feyér bewiesen. S. L. Fryer, Lagrangesche Interpolation und die zuge- 


hérigen konjugierten Punkte, Math. Annalen, 106 (1932), S. 68. Der hier mitgeteilte Beweis 
ist identisch mit der Beweismethode von L. FEejer. 
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voneinander verschiedene, reelle Werte, fiir welche —1<y<d<-+1 besteht. 
Dann muB es offensichtlich im Intervall (a,6) zwei verschiedene Punkte « 
und @ geben derart, daB g(@)—y und g(@)=0d. Wie wir vorausgehend 
bewiesen haben, liegt mindestens ein Punkt einer jeden Reihe des Punkt- 
systems (1.2.4), von einem bestimmten Index n an, im Inneren des Intervalls 
(a, ®). Daraus ergibt sich, daB sich die zu den im Inneren des Intervalls (a, 8) 
liegenden Grundpunkten gehérenden konjugierten Punkte wegen der Monotonie 
von g(x) — von diesem Index an — im Inneren des Intervalls (y, 0) befinden. 
Da y und oO beliebig nahe zu einander liegen kénnen, ist hiermit der Satz II 
bewiesen. 


(Eingegangen am 8. Juli 1958.) 
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A NOTE ON THE SECOND MAIN THEOREM OF P. TURAN 


By 
S. UCHIYAMA (Sapporo, Japan) 
(Presented by P. Turan) 


Let z,,2,,...,2, be m complex numbers satisfying the condition 
(1) 1 =z, = |%|=--- = |Z, 
and put for the sake of brevity 

Sy = 612 + by23 4+ +++ + On 22 
where the 0,’s are arbitrary complex numbers. Then the second main theorem 
in the title states that there exists an absolute constant A >O such that 
n , 
rie) aan a ee | hoe anemones as 
igiokenieie | (; (m + 5 Hotei [0 + +t b;| 

where m is a non-negative integer. 

It is known’ that the constant A in the second main theorem satisfies 


the inequalities 3 


(2) 2e °° 2 A= e% 
where @, is the (only) positive zero of the equation 
Ge! — |] 
and hence e%® ~ 1,321. It is to be noticed that the second inequality of (2) 
occurs even when the 8,’s are restricted in such a way that 6, =6,= --- =-b,—1. 


The purpose of this brief note is to prove that the constant A in the 
second main theorem in its full generality cannot be smaller than e. A proof 
will be supplied if we construct a suitable example with n complex numbers 
Z,---,2, satisfying (1) and the complex numbers 6,,...,6,: indeed, as is 
seen below, such an example exists in which all the 5;'s are reat numbers. 


Consider n complex numbers 2,, 2.,..., 2 such that 
(3) 2,20+++2n PE (zj—%) +0 
Jk 
1 : 
and put 6; = ——-~ iat | S ZG on 
P are, ¥ 


where fe) = [](e—2). It is then clear that © 
a e , \0 for 1seren—1, 
(4) , Le eae 1 for evn. 
1 Vera T. Sos and P. Turdn, On some new theorems in the theory of diophantine 
approximations, Acta Math. Acad. Sci. Hung., 6 (1955), pp. 241—255. 
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In fact, this is nothing but so-called EuLer’s identity and is well known. 
Let us take 
psp ot eee" (Fant 2 KY: 


Then the conditions (1) and (3) are satisfied and, by definition, the 6,’s are 
now real numbers. A simple computation shows that 


j-1 n" oss 
se GaGa EDL 


é aay AS * | a )- ga (8, 
2 = Fy a eet Ge Yl yh 
Thus we find that 
j 
>, bs) = 
k==t 


aS fen n 
—s mind , ate 
nl j=j=n\f—1 n! 


Now, by the second main theorem with m=O we must have 


(5) min 


1Sj=n 


lit ai. 
max |s,| = (4) lyat b,+-:-+6;)|, 


1SvSn 


and hence, using (4) and (5), 


Ae, 
n\- 
Since 
n ento(l) 
nt \2zn 
and n may be arbitrarily large, this last inequality implies that 
A=é, 


completing the proof of our assertion. 
(Received 15 July 1958) 


Added in proof (20 November 1958). The double inequality (2) can 
now be replaced by 
8e = A = 1,473; 
the second inequality is, according to a written communication of Prof. TURAN - 
with the author, a recent result of Mr. E. MAKAl who proved this for 


b, = b,=-+-+=6,—=1, while the first is seen without difficulty from the 
argument developed in '. 
We have 


4 
Qe © > 8e~ 21,746, 


1 1 
since e*>2?., 


PROBLEMS AND RESULTS ON THE THEORY 
OF INTERPOLATION. I 


By 
P. ERDOS (Budapest), corresponding member of the Academy 


x) 
Let x : xe be a triangular matrix of real numbers in (—1,+1), —1= 


= xi) <x < ++» <x”) = 1. It is well known that the unique polynomial of 
degree at most n—1, which assumes the values y, at xj(1 =k =n), is given 
by (the upper index n will be omitted if there is no danger of confusion) 
(x), ee Bs ery 
2 ve x (X) x(x) o (xx)(X— Xx) , w(x) IT x Xi). 


Clearly 
h, (xX) = 1, h(x) = Orefor Lsisa, 1-64, 


Let f(x) be a continuous function in (—1,+1). Put 


Lif) = 3 sls 


i.e. L,(f(x)) assumes the values f(x;) at x» (1 Ska). 
Let f(x) be continuous in (—1,+ 1). A well known theorem of HAHN’ 


states that the sequence L,(f(x.)) converges to f(x.) if and only if 


n 


(1) | > Hi (X)| <€ 


‘ k=1 
where c is independent of a. 
FABER’ first proved that for every point group there exists a function 


f(x) continuous in (—1,+1) for which L,(f(x)) does not converge uni- 
formly to f(x) in (—1,+ 1), FABER in fact proved that for every point group 


(2) lim max She =o. 


n=0 -lS7ssl k 


Actually: FABER proved slightly more, he shoved that 


(3) max > |/x(x)| >c log a. 
-lS¢S1 k=1 


1 H. Hann, Uber das Interpolationsproblem, Math. Zeitschrift, 1 (1918), pp. 115—142. 
2 G. Faser, Uber die interpolatorische Darstellung stetiger Funktionen, jJahresb. der 


Deutschen Math. Ver., 23 (1914), pp. 190—210. 
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From (2) and (3) it does not yet follow that to every point group there 
exists a point x, and a continuous function f(x) so that the sequence LiaCf(%)) 
does not converge to f(x), or what is the same thing (by HAHN’s theorem) 
that there exists an x, (—1 =X = 1). so that 


(4) iim |b) = @. 


S. BERNSTEIN’ proved (4), and in fact he proved that for a certain x, 
and for infinitely many n 


(5) 3 \be(%)| > (2 +00] log n. 


Inthe case of the Chebyshev abscissae 


n 


(6) max > |fe(x)|< log n+ O(1). 


-IaS1 kK=1 
Thus in some sense (5) is best-possible. (5) holds in fact for the Chebyshev 


abscissae for every x, and infinitely many n. 
_ In this paper we shall prove that for every point group (4) holds for 
almost all x.-In fact, we shall prove the following stronger 


THEOREM 1. Let ¢ and A be any given numbers, and let n> n= 1n,(é, A). 
Further let —1=xX,<%.<+++<X,1 be any n points. Then the measure 
of the set in x (—% <x< c) for which 


(7) > |te(x)| = A 
holds, is less than s. 


Theorem 1 clearly implies that (4) holds for almost all x in (—1,+1). 
It is well known that (4) does not have to hold for all x in’(—T,-+ 1), im 
fact, it is easy to see that there exists a Cantor set S so that for every x in S 


@) S lheol <e 


where c does not depend on a or x. To see this it suffices to start with the 
roots of 7,(x) and push two consecutive roots close together; we suppress 
the details which can easily be supplied by the reader. By slightly more 
complicated arguments one can show that the set S can have Hausdorff 
dimension 1. 


3 S. Bernstein, Sur Ja limitation des valeurs etc., Bull. Acad. Sci. de VURSS, (1931), 
No. 8, pp. 1025—1050. 
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By more complicated arguments we could prove the following stronger 


THEOREM 2. Let n>n,(A,c, 8,2) be sufficiently large, —1=x,<x,<--- 
*+<X, = 1. Then the measure of the set in x for which 


2 |u(x)| <A 


holds, is less than c/logn (c=c(A)). Further if n= n(s) is sufficiently small, 
then the measure of the set in x for which 


& |) = = nlogn 
holds, is less than «. 5 
The case of the Chebyshev abscissae shows that Theorem 2 is best- 


possible. We do not give the proof of Theorem 2 since it is similar but more 
complicated than that of Theorem 1. 


In a subsequent paper I shall prove that for every point group there 
exists a point x, (—1=x,=1) so that for infinitely many n 


(9) =: \le(x)| > log n—e. 


In view of (6) (9) is best-possible. 
Here the following question could be asked: For which distribution of 
points —1Sx%,<---<x, S1 Is 
max > 14(x) 


a minimum? It has been conjectured that this point group x,,%,...,Xn is 


uniquely determined by the fact that all the 2+1 maxima of Dane, 


in (x;, Xin) OSisn+1, HY=—1, Xu41=+1) are equal. Denote the value 
of this minimum by U,. We would further conjecture that for every other n 
points in (—L, +) (—1S3x%}<x,<-++-=x;, = 1) at least one of the n+1 


maxima of > K0) in (xj, Xf1) (0 SiS n+1) is less than U,. The only 


result I tan’ prove in this direction is that at least one of these maxima is 
less than n’/?,* 
It might be further worth-while to formulate the following conjecture: 
Let |z;|—=1 (1 Sizn). Then 
sien D3 |de(2)| 
12|= 
is a minimum if and only if the z,’s are the roots of z"—a, |a|—1. 


4 P. Erpés, Some remarks on polynomials, Bull. Amer. Math. Soc., 53 (1947), pp, 
1169—1176, Theorem 2 (p. 1171). 
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G. GRUNWALD’ and J. MARCINKIEWICZ’ proved simultaneously and inde- 
pendently that there exists a continuous function f(x) so that the sequence of 
Lagrange interpolatory polynomials L,(f(x)) taken at the Chebyshev abscissae 
diverge for every x (—1 =x = 1). In fact, they prove that for all x (—1=x=1) 
lim L,(f(x)) = ov. In a subsequent paper | hope to prove the following result: 


x) ; ; : 
c x be any point group. Then there exists a continuous function f(x) 
2 


so that for almost all x, lim L,(f(x))=. 


On the other hand, it is not true that there always exists a continuous 
f(x) so that L,(f(x)) diverges at all those x for which (4) holds. In fact, | 
can construct a point group so that for every continuous function f(x) there are 
continuum many points x, for which (4) holds and nevertheless L,(f(X))—> f(x) 
as n tends to infinity. 

If (4) holds for every x» (—1=x,=1), | can not decide whether there 
exists an f(x) so that L,(f(x)) diverges for every x (—1=x=1). 

One final remark. It is not difficult to construct a point group so that 
for every continuous function f(x) and every x, there should exist a sequence 
n, (depending on f(x) and x,) so that 


(10) lim Ln, (f(%)) —> £2). 


We can, in fact, construct a point group so that for every x, 


(11) lim > |a(%)| = 1 
which by HAHN’s theorem implies (10). 
The proof of (11) is easy, we just outline it. Let x,,..., Xi, Xi2,...,Xn 


1 


wisear) Then a simple compu- 


be n—1 roots of 7,,(x) and xxi | 
tation shows that for x =x = xin 


> |e)! =1+0(0) 


@ 
] pt ty d 
Now 2 allog ay = oo, thus it is easy to see that we can construct a point 


group whose n™ row is the above-modified Chebyshev point group and so 


5 G. Grinwatp, Uber die Divergenzerscheinungen etc., Annals of Math., 37 (1936), 
pp. 908—918. 

6 J. Marcinkiewicz, Sur la divergence des polynémes d’interpolation, Acta Sci. Math. 
Szeged, 8 (1937), pp. 131—135. 
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that every x, (—1 =x, =1) should be contained infinitely often in a ,short“ 
interval (x;, xi::) and thus (11) follows. 

Now we prove Theorem 1. We put xX)>= —1, Xn41=+1. Henceforth 
C;,C2,... will denote positive absolute constants independent of «, A and an. ~ 
The points x (—oo <x< oo) which Satisfy (7) we shall call bad points. 
Thus we have to prove that the measure of the bad points is less than e. 
First we prove the following 


LEMMA 1. The measure of the bad points x which satisfy any of the 
conditions 

a) are not in (—1,+1), 

b) for which min |x—x,| <¢/12n, 

Cc) which are int intervals (Xi, Xi1) Satisfying xi:1—x;>c,A/en, 
is less than 8/2. 


Let x, be a bad point not in (—1,+1). By interpolating x"! on the 
points x; (1 Si=n) we obtain for all x 


xm ta >" x81 (x) 
k=1 
or 


(12) x < Dhl) 
Now if |x.|=1 +4, then x"? > A, or we have from (12) that for |x| =1-+ A/nr 


& |b(x)| > A, 
k>1 


or if x, is bad we have |x)|<1-+A/n. Thus the measure of the bad points 
satisfying a) is less than 2A/n </6 for n>n. 

By similar arguments we can easily show that the measure of the bad 
yoints satisfying a) is less than c,/n®. In fact, it is easy to show that the 
neasure of the points x outside (—1,+1) for which 


max |,(x)| < A, 
1Sk=n 
s less than c,/n’. 
Since the number of the points x; is n+ 2, it is clear that the measure 
f the points in x satisfying b) is less than «/6. 
Now we have to deal with the bad points satisfying c). Let —1<§=1. 
| is well known’ that there exists a polynomial p,_,(x) of. degree at most 


* See e.g. P. Erpds and P. Turdn, On interpolation, II, Annals of Math., 39 (1938), 
P12. 
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n—1 for which 

. Cs te <A 
(13) pPni(E)=1, |p(xX)|< min (eu aos] for ee | ear 
Assume now that 
(14) min |E—x,| >¢,A/n. 


Sk=n 
Then we obtain from (13) and (14) 
| 
(15) | Pu-1(Xx)| < A (sk=n). 


Thus from (15) and the identity Pui (E)= 2 Pr-1%i) Ue) we obtair 


or a point € can be bad only if ) 
(16) min |§—x,| =c,A/n. 


1Sk=n 

The number of intervals (x;, Xi+1) satisfying x1—x;>c,A/en is clearly 
less than en/c,A and thus from (16) the measure of the bad points satisfying 
c) is less than 

265A | OR) 12658 5 2 
n cA CQ 63 
if c, > 12c,. Thus the proof of Lemma 1 is complete. 

To complete the proof of our theorem we only have to prove that th 
measure of the bad points not satisfying any of the conditions a), b) andc 
is less than e/2. In other words, we have to prove that the measure of the 
points x (satisfying —1=x=1) which are in intervals (x;, xi:1) satisfying 


& c,A A 
—— < Xi41 — X < — and for which 
6n i+l t en 


(17) Xi+ 


and which satisfy (7), is less than ¢/2. 

If the above statement is false there clearly must exist at least en/2c,/ 
intervals (x, X41), Xivi—Xi <c,A/en, which contain bad points satisfying (17 
But then there must exist at least #&n/4c,A such intervals 

ey \ 
—4c,A 


which do not have an endpoint in common and each of which contains ba 
points satisfying (17). Now we prove 


(18) (XeT Mi) (1 aa 
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LEMMA 2. Assume without loss of generality that |w'(x;)| = \@'(xi,1)). 


Then for any x satisfying (17) and x:1—x;=c,A/en (i. e. not satisfying c)) 
we have 
| Lisi (x)| = Co"/A. 


It is known® (and easy to see) that for x;< x < x4; 
(19) L(x) + lisa(x) > 1, 
or by |w’(x;:)| = |w’(x:)| we have for x;< x < Xiu 
20 ; (x) (x) 
( ) @ (Xi+1)(x— xi) as o (Xin: )(x— ey i 
Now since x satisfies (17) and (x;, Xi:1) does not satisfy c) we have 
ena 


(21) |x—x;| > 
Thus from (20) and (21) 


|x—Xi+1|. 


Jiax(a)| (1+ 294 Joa 
which proves the lemma. 
LEMMA 3. Let y,, Yo,-.., Ye be any t (t >t) distinct numbers in (—1,+ 1) 
not necessarily in increasing order. Then for at least one u (1 Su St) 
1 S tlog t 
i=l |Yu—Yi| 8 
If the lemma would be false we would have 
. 1 = tlogt 
1siajst Vi— Jj 8 
where the y’’s are ordered by size, i.e. —lSyj<yr<-:>< yi =. But itis 
easy to see that (22) is false. To see this observe that 


t-k 
2 (Vix) < 2k, 


and using the inequality between the arithmetic and harmonic mean, we 
obtain 


(22) 


t-k 9 
Pe ee ee 
i=1 Yisr—Ji 2k 2k 
or 
1 eS UenZES f log t 
Pe peas yi— yy; peace 1 aor ee 8 


fort>t, which proves Lemma 3. 


8 See P. Erpés and P. Turdn, On interpolation. Ill, Annals of Math., 41 (1949), 
Lemma IV, p. 529. 


10 Acta Mathematica IX/3—3 


388 P. ERDOS: PROBLEMS AND RESULTS ON THE THEORY OF INTERPOLATION, 1 


Consider now the intervals (18). By assumption each of them contains 
bad points satisfying (17). Define 
Yi, = Xi, if |w’(x:,)|2lo'(%,+1)|, otherwise yi, = Xi. 
Reorder the y;, as follows: 


(23) lo W1slo'O9S-~- s|o'OD, =| GF]. 


By Lemma 3 there is a y, so that 
1 re tlog t 


24 —— 
ad = [Yu—i| 8 
We have (say) y= <i,. Now we show that the interval 
é é 
(25) Xi, Top <4 SX — Top 


does not contain any bad points, and this contradiction will complete the 
proof of Theorem 1. To see this let x satisfy (25). 

We have form (24) and (23) by a simple computation that for the x’s 
satisfying (25) we have for n> nj(e) 


., Hog t nlogn 
Sd: SP 1G 20g 
Further clearly 
(27) & |e@)| > 2" |h(x)| 


where the dash indicates that the summation is extended only over those 
X;’s which are equal to one of the y; (1 Si=u). By (23) we have (x; =.) 


@) TK T) =O |=|5, 98, |5 |= 


oo’ (Xx)(X—Xx) | ~ |@'(Yu)(x—u) | | x— i | 
Now, by Lemma 2, (23) and (26) we have (x—v1> 5 >= n bY (25)) 


w(x) | Si[x—wl_ oe 2@ SS 1 & 98 niogn 
Oem ¢ x—YVi A l2nf8ix—y,~ 12n 20. 
which completes the proof of Theorem 1. 


i=l 


(Received 1 August 1958) 


ON MIXING SEQUENCES OF RANDOM VARIABLES 


By 
A. RENYI (Budapest), member of the Academy, and P. REVESZ (Budapest) 


Introduction 


In a recent paper [1] the first named author proved the following 
THEOREM 1. Let [82, 1, P] be a probability space (i.e. P= P(A) a prob- 
ability measure defined for sets A belonging to the o-algebra € of subsets 
of the set 82). Let C, be a sequence of sets such that Cx =2,C,€A and 
P(C,) >0 for n=1,2,.... If for kK=0,1,2,... the condition’ 
(1) lim P(C,|Cx) =4 (0<’<1) 


is fulfilled, then for any BE & such that P(B)>0 we have 
(2a) lim P(C,|B)=A4. 


This implies that if Q is an arbitrary measure on & which is absolutely 
continuous with respect to P, we have 
(2b) . lim Q(C,) =4. 


We shall say that a sequence {¢,} of random variables defined on the 
probability space [9,4,P] has the “mixing” property (or simply: is 
»mixing“) if | 
(3) P(E, < x|B)=> F(x) 
for every BEA with P(B)>0, where F(x) is a distribution function not 
depending on B. Here ==> denotes, as usual, the weak convergence of a 
sequence of distributions to a limiting distribution (i. e. that P(C, < x) tends 
for n—+0o to F(x) for every x which is a continuity point of F(x)). 

It has been shown in [1] that in case {¢,} has the mixing property, 
and Q is a measure on which is absolutely continuous with respect to P, 
then 
4) Q (En < x) => F(X), 

In [1] it has been proved by means of Theorem 1 that if &,&,... are 
independent random variables, A, and B, sequences of real numbers such 


1 P(A|B) denotes the conditional probability of A with respect to the condition B. 
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that B,->-+ cc for n—+co and putting 
aad E+6+---+5,—A, 


wy 


(5) : B, 

we have 

(6) P(o, < x) ==> F(x) 

where F(x) is a distribution function, then the sequence ¢, is mixing, i. e. 
(3) holds. 


This result has been proved previously only under some restrictions 


in [2] and [3]. 
As the random variables (5) form an (additive) Markov chain, it is 
natural to ask whether general Markov chains do possess also under suitable 


conditions the mixing property. 
In § 1 it is shown that it is rather easy to find sufficient conditions 


for a sequence of random variables being mixing. The conditions in question 
are, especially, satisfied for certain Markov chains. This is shown in § 2 by 
giving some examples. 


§ 1. Some conditions for a sequence of random variables 
being mixing 


Let &,5,,6.,... be a sequence ‘of (real-valued) random variables and 
suppose that for any real x and for any possible value y of &, we have for 
fl— co 
(Lata P (Oy x[o: = v) => F(x) 
where F(x) is a distribution function. 

Putting P, (x) =P (<x) we have for any real z 


(1. 2) P(r <x1 <2) pi | PGs < alt —y)aP. 0). 


Thus, by the theorem of LEBESGUE on the integration of bounded convergent 
sequences of functions it follows from (1.2) by virtue of (1.1) that 


(1. 3) lim P (on <x|k < z) = F(x) 


for every point of continuity x of F(x). Especially we have (for z= + ov) 


* It suffices to suppose that (1.1) holds for y € By where P (sx € Br) =1. 
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Thus, applying Theorem | to the sets C,=2, C,={w:6,(w) <x} 
(n=1, 2,...) we obtain that if Q is a probability measure on & which is 
absolutely continuous with respect to P, we have 
(1.5) Q(o, <x) => F(x). 

Evidently, condition (1.3) is also necessary for the validity of (1.5). 
Thus we have obtained the following 


THEOREM 2. The sequence {C,}(n =O,1,2,...) of random variables 
defined on the probability space [82,,P] has the mixing property if and only 
if for every k=O, 1,2,... there exists a set E; for which P (& € Ex) =1 and 
is such that for y€ E, we have for n—+oe 
(1. 6) P(C, ox|oe==y) ==> F(x) 
where F(x) is a distribution function not depending on y. 

Theorem 2 can be applied, especially, to verify the mixing property of 
Markov chains. 


§ 2. Examples 


EXAMPLE 1. Let {¢,} be a Markov chain. It follows from a well-known 
theorem of KoLtmocorov [4] that condition (1.6) is satisfied (moreover, the 
convergence is uniform) if the following two conditions are fulfilled: 

a) For any pair x,y of possible values of ¢, and for any measurable 
set G we have 
(2. 1) P (Sess € G[ Sx =x) & Ax P (Carr € G|Se = 9) 


for K=O, 1, 2,... where the constants 2,0 are such that 


(2. 2) Pa green 
b) P.Gn < x)==> F(x) for na—>oo. 


EXAMPLE 2. Let {¢,} be a homogeneous Markov chain having a finite 
number of possible states. Suppose that each ¢, can take on only the values 
1,2,...,r. Let us denote by pj the transition probabilities of the Markov 


chain {¢,}, i.e. put 
(2. 3) py =P Cnt = S152 = 9) 


and denote by zc the matrix (pj). Suppose that there exists a positive inte- 
ger s so that all elements of z° are positive. Then, as well known, (1. 6) is 
satisfied. Thus it follows from Theorem 2 that the Markov chain {¢,} is 


mixing. 
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EXAMPLE 3. Let the random variables ¢, (a =O, 1, 2,...) defined on the 
probability space [2, ,P] form a homogeneous Markov chain. Let C, and 
D, >0 be two sequences of real numbers such that for any fixed k(k=1,2,...) 
we have 


(2. 4) lim Prk and lim aT Ort 90, 
further 
(2. 5) p( a5 ecem |= F(x), 


where F(x) is a distribution function which is independent of the value of 
y where y may take on any element of a set Y such that P(¢,€ Y)=1. 
Then we have 
Cn —Ch 
(2. 6) Q( ES < 
for any probability measure Q on & which is absolutely continuous with 
respect to P. 
As a matter of fact, owing to the supposition that the Markov chain is 
homogeneous and the supposition (2.4), it follows from (2.5) that if 
n—>oo, then 


@7 p(e5 oc. 


x| > Fe) 


Ok = y| => F(x) 


for k=O, 1, 2,...; thus our assertion follows from Theorem 2. 


EXAMPLE 4. Let us consider the Engel’s series of the real number f 
(O0<t<1) 
1 


2.8 foe RGR Bh akineat tela, ap: 
hae) 7d ak a hea Gat gi 


where g, q(t) = 2 is an integer. It is known (see [5] and for another 


proof [6]) that sea is in the limit for n+ normally distributed, that is 
n 


log 2 —n 


(2. 9) lim bes <x]=q= [ Fay 
} n-+00 V2 


where P denotes the Lebesgue measure. It has been shown in [6] that the 
random variables log q,(f) are forming a homogeneous Markov chain on the 
probability space [§2, Cl, P] where §2 is the interval (0, 1), @ the set of meas- 
urable subsets of 2 and P(A) the Lebesgue measure of A€d@. 
It is easy to see from the proof given in [6] that (2.9) remains valid also 
under the condition g, =k where kK=2 is an arbitrary integer. As forC, =n, 
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D,=Yn the conditions (2.4) of Example 3 are satisfied, it follows from 
Theorem 2 that 


u2 


. l es 5. ] ~ wt 
es eet saya et ons a< t=) 


if Q is any probability measure in the interval (0,1) which is absolutely 
continuous with respect to the Lebesgue measure. 


(Received 6 August 1958) 
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MAXIMUM-MINIMUM SATZE. UBER GRAPHEN 


Von 
T. GALLAI (Budapest) 
(Vorgelegt von G. Hajés) 


Einleitung 


Im folgenden behandein wir in vereinfachter Weise die Ergebnisse einer 
kiirzlich in ungarischer Sprache erschienenen Arbeit ((9J, [10]). Wir beweisen 
mehrere, dem Mengerschen ,,n-Kettensatz“ ([14], S. 222) ahnliche ,Maximum- 
Minimum“ Satze. EGERvARy verallgemeinerte (in matrizentheoretischer Formulie- 
rung) den auf paare Graphen beziiglichen Spezialfall des Mengerschen Satzes 
in solcher Weise, daf er die Kanten der Graphen mit Zahlen bewertete und 
statt des Maximums der Kantenanzahlen gewisser Kantenmengen das Maximum 
der Wertsummen der betrachteten Kantenmengen nahm ({3], S. 17, I). Den allge- 
meinen Mengerschen Satz kann man nicht in der gleichen Richtung ausdehnen. 
Es gelingt aber, einen der Egervaryschen Verallgemeinerung ahnlichen Satz 
dadurch zu finden, daB man statt ungerichteter Graphen gerichtete, statt 
Wege gerichtete Kreise nimmt. In gleicher Weise kann man aus dem _ ,max- 
flow min-cut* Satz ({1], [5], [6], [7]), der den Mengerschen Satz als Spezial- 
fall enthalt, mehrere der Egervaryschen Verallgemeinerung entsprechende 
Satze herleiten (Satze (2.1.6), (3.1.4), (3.2.3), (3. 2.6)). Wir werden jedem 
dieser Satze je einen ,dualen“ Satz zur Seite stellen (Satze (2.1.7), (3.1. 5), 
(3. 2.4), (3.2.7)). Durch Anwendung der erhaltenen Satze auf besondere 
Graphen bzw. Bewertungen gelangen wir zu weiteren Maximum-Minimum 
Satzen (Satze (4. 2.3), (4.2.5), (4.2.7), (4.2.9), (4.3.1), (4.3.3), (4. 3.5), 
(4. 4. 12), (4. 4. 13)), die sich auf Wege bzw. auf Kanten beziehen, und die 
als Spezialfall den ,max-flow min-cut“ Satz, den erwdhnten Egervaryschen 
Satz und einen von DILWORTH stammenden, auf halbgeordnete Mengen 
beziiglichen Satz ([2], S. 161, 1.1) enthalten. 

Es ist bemerkenswert, daB in den Satzen die Ganzwertigkeit der Bewer- 
tung die Ganzwertigkeit der anderen auftretenden Zahlenwerte nach sich 
zieht. Wir werden unsere Satze erst unter Beriicksichtigung der Ganzwertig- 
keit ableiten und nur nachtraglich zeigen, daB sie auch mit nicht ganzzahli- 
gen Bewertungen in Kraft bleiben’ (Abschnitt 2. 5). 

Man kann unsere Sdtze auch auf unendliche Graphen ausdehnen. Das 


zeigen wir in Bezug auf Satz (2.1.6) (Abschnitt 2. 6). 
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Als Anwendung beweisen wir zwei Satze beziiglich Faktoren (Satze 
(5.1.2), (5.2. 2)), und wir leiten aus diesen einen Satz von Ore ([15], S. 405, 
Theorem 2. 3. 2), sowie einen Satz von TUTTE ([16], S. 930) ab. 

Unser Beweisverfahren stammt aus der in [8] angewendeten Methode. 
Man kann dieses Verfahren sowohl auf die Satze (2. 1.6), (2.1.7), als auch 
auf die Satze (3.2.6), (3.2.7) anwenden, doch sind die Beweise der erst- 
genannten Sd&tze viel einfacher (siehe [9] und [10]). Gliicklicherweise lassen 
sich jedoch mit einem durch FORD und FULKERSON ersonnenen Verfahren 
((6], S. 212) aus (2.1.6) und (2.1.7) die Satze (3.2.6) und (3.2.7) leicht 
herleiten (Abschnitt 3. 2). 

Zuletzt zeigen wir, daB die Satze (2.1.6) und (2.1.7) auch mit Hilfe 
des Dualitatssatzes der Theorie der linearen Programmierung (s. [11], S. 58—65) 
ableitbar sind (§ 6). 


§1 
1.1. Grundbegriffe 


Betrachten wir zwei nichtleere Mengen ®und &. Es sei ® die Menge 
der Knotenpunkte — im folgenden einfach nur Punkte — W die Menge der 
gerichteten Kanten. Wir bezeichnen einen beliebigen Punkt mit X, eine belie- 
bige Kante mit x. Auch die mit Indizes versehenen Buchstaben X und x 
sollen Punkte bzw. Kanten bedeuten. Der gerichtete Graph I ist dann gege- 
ben, wenn es vorgeschrieben ist, welche Punkte und Kanten zueinander 
inzident sind. Wir geben die Inzidenzen in folgender Form an: Man ordnet. 
zu jedem Paar der Elemente x und X eine Zahl (x, X) mit folgenden Eigen- 
schaften zu: 


(1) es gebe zu orae x ein X’ und ein X” mit 
1 

2° 5» %X)=0, falls X4-X,X"; 

(2) es gebe zu jedem X ein x mit (x, X)+0. 

Die in (1) auftretenden Punkte X’ und X” heiBen die Randpunkte der Kante 

x, X’ ist der Anfangspunkt, X” der Endpunkt. Wir werden die Behauptung, 

daB X’ der Anfangspunkt, X” der Endpunkt der Kante x ist, kurz mit der 

Gleichung x—x(X’ X”) ausdriicken. Auch die folgenden Ausdrucksweisen 

werden wir beniitzen: die Kante /duft von ihrem Anfangspunkt aus, (duft in. 

ihren Endpunkt ein, ist zu jedem ihrer Randpunkte inzident. 

Die Bestimmung eines ungerichteten Graphen unterscheidet sich von 
der vorausgehenden Definition nur darin, daB die Funktion (x, X), welche 
die Inzidenzen angibt, fiir eine jede Kante und fir die beiden zu der Kante 
gehérigen Randpunkte den Wert 1/2 annimmt. 


(x, X’) = — (x, X”) => 
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Im folgenden verstehen wir — wenn nicht das Gegenteil bemerkt wird 
— unter einem Graphen immer einen gerichteten Graphen. 
Sind die Mengen ® und & endlich, so heift der Graph endlich. 


1.2. Ketten 


(1.2.1) Es sei f(x) eine auf der Menge & definierte ganzwertige Funk- 
tion. Wir nennen die lineare Form >, f(x)x, sowie die Funktion f(x) selbst 


(diese Zweideutigkeit fiihrt zu keinem Mifverstandnis) eine Kette und bezeichnen 
sie mit f. Der Wert f(x) heift die Multiplizitat der Kante x in f. Ist die 
Anzahl der Kanten, die in f eine von Null verschiedene Multiplizitat haben, 
endlich, so heift die Kette endlich. In dieser Arbeit treten nur endliche Ketten 
auf, und deshalb wird das Wort ,endlich“ meistens weggelassen. 

Sind die in f vorkommenden, von Null verschiedenen Multiplizitaten 
simtlich positiv, so nennen wir die Kette positiv. Die Positivitat der Kette f 
drticken wir mit der Ungleichung f=O aus. Im allgemeinen fassen wir eine 
sich auf Funktionen beziehende Ungleichung bzw. Gleichung, in der das 
Argument nicht explizit vorkommt, derart auf, daB sie fiir jeden Argument- 
wert besteht. Dementsprechend bedeutet f—0, daB jede Kante in f die 
Multiplizitat Null besitzt. f=-0 soll die Negation von f—0O bedeuten. 


tie, 2) Sind fiy---)fn Ketten, 2,,...,4, ganze Zahlen, so ist auch 
f=Afit---+4fr eine Kette. Sind die Ketten f,...,fr, sowie die ganzen 
Zahlen 4,,...,4, positiv, so ist auch f positiv. 

f' cf soll bedeuten, daB die Ketten f’ und f den Ungleichungen f’f=0 
und |f’| =|f| gleichzeitig geniigen. 

Man kann die folgenden Behauptungen leicht einsehen: 

Ist f’ cf, so ist auch f—f’ cf. 

Aus f=0 und /’ cf folgt f’ 29. 

Sind f,,...,f: positive Ketten, und ist f=fit---+fn, so ist fcf 
fra |, . 2, ft). 


(1. 2. 3) Besitzt die Kette f die Eigenschaft, da6 mit Ausnahme einer 
Kante x’ jede Kante in f die Multiplizitat Null besitzt und |f(x’)|=1 ist, So 
nennen wir die Kette f eine Kante. (Wir werden solche Kanten gewohnlich 
mit e bezeichnen.) Um die urspriinglichen Kanten von den jetzt definierten 
zu unterscheiden, werden wir die ersteren Grundkanten nennen. Kann jedoch 
kein MiBverstindnis vorkommen, so werden wir statt Grundkante einfach 
Kante sagen. 

Ist e eine Kante und ist |e(x’)|=1, so heiBt x’ die Grundkante von e. 
Im Falle e(x’)=1 ist e=x’. e ist jetzt eine positive Kante und wir sagen, 
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daB der Anfangs- bzw. der Endpunkt der Kante e mit dem Anfangs- bzw. 
dem Endpunkt der Grundkante x’ zusammenfallt. Falls e(x’)—=—1 ist, gilt 
e—-—x’. Wir nennen jetzt e eine negative Kante, und wir verstehen unter 
dem Anfangs- bzw. Endpunkt der Kante e den Endpunkt bzw. Anfangspunkt 
der Grundkante x’. (Wie ersichtlich, kann man die positiven Kanten mit den 
Grundkanten identifizieren.) Wir werden die Tatsache, dai X’ der Anfangs- 
punkt, X” der Endpunkt der Kante e ist, durch die Gleichung e=e(X’ X”) 
ausdriicken. 


(1. 2.4) Ist f(x)=: 0, so hei&t x eine Grundkante der Kette f. Ist fe=0O 
und fe=-0, so sagen wir, dab e eine Kante von f ist, oder dab e auf f liegt, 
oder dai fe enthdlt. Da wir nur endliche Ketten betrachten, hat jede Kette 
nur endlich viele Grundkanten und Kanten. 

Ist e eine Kante von f und x’ die Grundkante von e, so nennen wir 
den Wert |f(x’)| die Multiplizitat von e in f. 

Es sei die Folge e,,...,e, aus Kanten der Kette f gebildet. Kommt 
eine jede Kante von f in der Folge ebensooft vor, wie die Multiplizitat der 
Kante in f ist, so gilt die Gleichung f—e,+---+e,, und wir sagen, daf 
die Anzahl der Kanten von f gleich n ist. Wir werden diese Anzahl der 
Kanten von f mit »(f) bezeichnen. Wie ersichtlich, ist v(f)= > |f()|, wo 


das Zeichen > die Summation nach allen Grundkanten x bedeutet. 
In ahnlicher Auffassung wollen wir von der Anzahl derjenigen Kanten 
von f sprechen, die zu einem Punkte X inzident sind, von X auslaufen bzw. 


in X einlaufen. Wir bezeichnen diese Anzahlen, in der gleichen Reihenfolge, 
mit rx(f), vx(f), vX¥(f). Es gelten die Gleichungen 


rx(f)=2 DASA X), re —=—2 DF) X), 
ri (f) = 2 D” F(x) (%, X); 


hierbei bedeuten die Zeichen >” bzw. A die Summation nach denjenigen 


— 


Grundkanten, welche die Ungleichungen T(x) (x, X) <0 bzw. f(x) (x, X)>0 
befriedigen. 


Ist 7x (f) >0, so sagen wir, daB X ein Punkt von f ist, oder dab X 
auf f liegt, oder daB f X enthdlt. Wegen der Endlichkeit der vorkommenden 
Ketten enthalt jede Kette nur endlich viele Punkte. 


(1.2.5) Wir fiihren das Zeichen (f, X) ein: 
(f. X)= DM) (%, XY) =F (8 (= ve). 
Ist f= Safe so gilt (fF, Xess X). 


: 
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Besitzt die Kette f die Eigenschaft, daB fiir jeden beliebigen Punkt X 
die Anzahl der von X auslaufenden Kanten von f gleich der Anzahl der in 
X einlaufenden Kanten von f ist, d.h. wenn fiir jedes X (f, X)=0 ist, so 
nennen wir die Kette f geschlossen, oder wir sagen, daf f ein Zyklus ist. 
Wir werden die Zyklen gewohnlich mit dem Buchstaben z bezeichnen. 


Sind z,,...,2, Zyklen, 4,,...,4, ganze Zahlen, so ist auch z= > dz, 
ein Zyklus. via 


(1. 2.6) Es sei 
(*) Pei tyearenai lan 


eine Folge von Punkten und Kanten, welche die folgenden Eigenschaften 
besitzt: 


er=e:(Xi-1Xi) (i=1,...,0), Xi X; wenn ij (i,/=0,1,...,0). 


Dann heifit die Kette f—e,+---+e, ein Weg, genauer ein X,X,-Weg, und 
wir nennen die Folge (*) die zum Wege f gehdrige Folge. X, und X, sind 
die Randpunkte, X, der Anfangspunkt, X, der Endpunkt des Weges. Die 
Punkte X,,..., X,-1 nennen wir — wenn solche Punkte vorhanden sind —- 
die inneren Punkte. 

Es ist vorteilhaft, auch die Kette f—0 als einen XX-Weg zu betrachten, 
wo X jeden beliebigen Punkt bedeuten kann. 


k 
Die aus den Elementen der Folge (*) gebildete Kette f= Die 


(1 =j=k=n) ist ein X;-, X,-Weg. Es gilt f’ Cf, und wir bezeichnen f’ als 
den X;-; X,-Teil von f. Den Weg f’ =O werden wir als, den xX; X;-Teil von 
Be betrachten(i==—0,.1,...,J2). 

Ist in der Folge X,e, X,... Xn-1€n Xn Xo = Xn, Sind jedoch Xo, X,...,Xn-1 
alle voneinander verschieden und gilt e;=e;(X;1X,) ((=1,..., 2), so heiBt 
die Kette f—e,+---+e, ein Kreis. Wir werden die Kreise gewohnlich mit 
dem Buchstaben & bezeichnen. Wir betrachten auch die Kette f= 0 als einen 
Kreis. 

Ist f ein Weg oder ein Kreis, so gilt |f|=1. : 

(1.2. 7) Satz. Man kann jeden Zyklus z in der Form z= 2 ki dar- 
‘stellen, wobei k; einen Kreis mit k,<z bedeutet (i=1,..., 17). <a 


Bewels. Ist z=0, so kann man n=1,k,=0 setzen. Es sei z=-0, 
und es sei e, =e,(X,X,) eine beliebige Kante von z. Wegen der Geschlos- 
senheit der Kette z existiert eine zu z gehdrige Kante e,—e,(X, 2). Aus 
dem gleichen Grunde gibt es auch eine zu z gehdrige Kante e; =e; (X». X3) 
usw. Da jedoch z nur endlich viele Punkte enthdlt, miissen in der Folge 
X,, X,, Xo,... gleiche Punkte vorkommen. Bezeichnen wir mit m die kleinste 
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Nummer, fiir die X,,—X-1 mit 1<m gilt; so ist k,= de ein Kreis, k,=— 0 


und k, cz. Ist k, =z, so ist der Beweis beendet. Ist ky z, so ist der Zyklus 
z—k,=+-0, und die Zahl der Kanten von z—A, ist kleiner als diejenige von 
z. Wir kénnen unser Verfahren auf z—k, wiederholen. So erhalten wir einen 
Kreis k, mit k,cz—k, und k,=-—-O usw. Da z nur endlich viele Kanten 
enthalt, kommen wir nach einer endlichen Anzahl von Schritten zum Ende. 
Unsere Behauptung ist damit bewiesen. 

Wir bemerken, dai die in (1. 2.7) angegebene Darstellung auf mehrere 
Weise realisierbar ist, und man kann im Falle z=-0 auch die Forderung 
k;=- 0 (i=1,..., 2) erfiillen. 

(1.2.8) /st e=e(X’X”) eine Kante eines Zyklus z, so gibt es einen 
X”X'-Weg f mit fCz. 


BEwWEIS. Nach (1. 2.7) ist z= > ki, wok ein Kreis mit ki; C z (i=1,...,2) 


ist. e muB in einem der Kreise X;, aie Beispiel in k,, enthalten sein. ‘Dant 
ist jedoch f—k,—e ein gesuchter Weg. 

41.2.9) Ist fi ein Xi-1 X-Weg (i=1,...,n), so gibt es einen X. X,- 
Weg f mit fofite--+hi. 

BEwEls. Ist X,—X,, so kann man f=O setzen. Es sei X,=+ X,. 
Erganzen wir dann den Graphen I mit einer neuen Grundkante yy (X,,X,). 
In dem so entstandenen Graphen ist z—f,+---+/,+y ein Zyklus, der die 
Kante y enthalt. Nach (1.2.8) gibt es also einen X,X,-Weg f mit fcz. 
y kann aber nicht zu f gehdren, und so gilt auch fCfi+---+fr. 

(1.2.10) Aus (1. 2. 2), (1.2.7) und (1.2.9) ergeben sich die nachste- 
henden Satze: 

Jede Kante einer positiven Kette ist positiv. 

Man kann jeden positiven Zyklus als Summe von positiven Kreisen 
darstellen. 

Ist f; ein positiver X;. X-Weg (i=1,...,n), so gibt es einen positiven 
X, Xn- Weg. 


§ 2 
2. 1. Die Bewertung der Kanten. Die Haupts&tze 
(2.1.1) Es seien f und g positive Ketten. Wir wollen mit dem Wert 
I gi = VF@E@) 


den ,lInzidenzgrad“ der Ketten f und g ausdriicken. Sind x,...,x, die 
Grundkanten des positiven Kreises k, so ist |f, k|}=f(x.)+---+/(x,), d.h. 
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\f, k| gibt die mit Multiplizitaten gerechnete Zahl der auf k liegenden Kanten 
von f an. 


n 


Ist &= 2, £i go,=—0 (T==1,..., 7”), SO. pilt A al= 2 hail. 


(2.1.2) Es seien g(x) und w(x) zwei — in diesem Paragraphen fest- 
gehaltene — auf der Menge # definierte ganzwertige Funktionen. Wir nen- 
nen die Werte g(x) und w(x) den g-Wert bzw. den w-Wert der Kante x. 
Ist f eine Kette, so soll 
glf=Le®)fe) baw. yIA=Ly@ se) 
der g-Wert bzw. der w-Wert von f heifBen. Nach unseren Annahmen sind 
samtliche g- und w-Werte ganzzahlig. 


Ist f= Duh so ist viAl= 2 yl. 
Wir nennen einen positiven Zyklus z kanteaufnehmbar bzw. kantefiil- 


lend, wenn z= @ bzw. z= @ gilt. 
Die positive Kette f heiBt kreisaufnehmbar bzw. kreisfiillend, wenn fir 


jeden positiven Kreis k | f,k| = p[k] bzw. |f, k| = w[k] besteht. 
(2.1.3) Ist f=0 und ist f kreisaufnehmbar bzw. kreisfiillend, so gilt 
fiir jeden positiven Zyklus z |\f,z|=~p[z] bzw. |f,z|= yIzl. : 
BEweEls. Ist z ein positiver Zyklus, so ist nach (1.2.10) z=) k;, wo 
die k; positive Kreise bezeichnen. Ist nun f kreisaufnehmbar, so gilt 


A= Dis kl = Sve] = vee 


Ahnlich sieht man die auf kreisfiillende Ketten beziigliche Behauptung ein. 
Wir bezeichnen die Menge der kanteaufnehmbaren bzw. kantefiillenden 
positiven Zyklen mit 2. bzw. Z;, die Menge der kreisaufnehmbaren bzw. 
kreisfiillenden positiven Ketten mit F. bzw. Fy. 
(2.1.4) Ist z€ Z, und f €F;, so gilt y[z] = oLS).- 
BEwEIs. Nach (2. 1.3) ist 
wl) sf 2zl= LTI/@2@) = VI/@e@) = gl. 


_Ahbnlich kann man die folgende Behauptung beweisen: 
(2.1.5) Ist z€Z; und fe Fa, so gilt »[z] = 9[f]. 
Aus (2.1.4) und (2.1.5) bekommt man die folgenden Ungleichungen : 
= mi ; mi z| 2 max ; 
mae ylz= pa ee pain at ] LeeeAUd 


vorausgesetzt, daB die vorkommenden Extremwerte existieren. 
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In den Abschnitten 2.2, 2.3 und 2.4 beweisen wir die folgenden zwei 
Hauptsdtze : 

(2.1.6) Satz. Ist I” endlich und ist ¢ =O, so existieren die Werte 
max w[z] und Cute g[f], und diese Werte sind einander gleich. 
2€Zq f 

(2. 1. 7) Satz. Ist I" endlich, und ist fiir jeden positiven Kreis k w{k] = 0, 
liegt ferner jede Kante x, fiir welche p(x) >0O ist, auf einem positiven Kreis, 
so existieren die Werte a wz] und nie g[f], und diese Werte sind einan- 

z af a 


der gleich. 


2.2. Zwei Hilfssatze 


(2. 2.1) Hitrssatz. Ist I” endlich, und ist fiir jeden positiven Kreis k 

w[k] <0, so existiert eine auf ® definierte ganzwertige Funktion s(X), fiir die 
y (x) S s(X”)—s(X’) 
fiir jede beliebige Grundkante x = x(X’X"’) besteht. 

Bewels. Es sei X ein beliebiger Punkt des Graphen J, und bezeich- 
nen wir mit H(X) die Menge der positiven X,X-Wege, wobei X, samtliche 
Punkte des Graphen durchlauft. Da I endlich und der XX-Weg f=O ein 
Element von H(X) ist, ist H(X) endlich und nicht leer. Es existiert also 


t 
der Wer 56x) = ET 


fEH(X) 
Wir zeigen, daB s(X) den gewiinschten Forderungen entspricht. Erstens ist 
s(X) offensichtlich eine ganze Zahl. Es sei nun weiter xx (X’X”) eine 
beliebige Kante und f’ ein positiver X,X’-Weg, fiir den y[f’]—s(X’) gilt. 

(1) Enthalt f’ den Punkt X” nicht, so ist f’—f’+ x ein positiver 
X,X”-Weg, und es besteht 

5(X’) + YX) = VIF1+ ¥@) = YIP7 5 5X’. 

(2) Enthalt f’ den Punkt X”, so teilt X” den Weg f’ in die Teile ff 
und fz, wo ff ein positiver X,X’-Weg, fg ein positiver X” X’-Weg ist. Es 
gilt ~[ fi] = s(X”), und da k= f3+x ein positiver Kreis ist, besteht auch 
w[ft] + w(x) = y[k] = 0. Aus diesen Ungleichungen folgt 

3(X’) + YX) = YA] + YL + YQ) S 5(X’). 

Aus (2.2.1) kann man den folgenden Satz leicht ableiten: 

(2. 2. 2) HitFssatz. /st I’ endlich und ist fiir jeden _positiven Kreis k 
lk] = 0, so existiert eine auf ® definierte ganzwertige Funktion s(X), fiir die 
w(x) = s(X")—s(X’) 

fiir jede beliebige Grundkante x = x(X'X") besteht. 
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2.3. Beweis des Satzes (2.1.6) 


(2. 3.1) Zuerst beweisen wir, daB der allgemeine Fall auf den Fall gy >0 
ruriickfiihrbar ist. Wir nennen eine jede Kante, deren g-Wert gleich Null ist, 
sine O-Kante. Wir zeigen, da®B die Weglassung der O-Kanten weder die 
Existenz noch die GréBe der im Satze auftretenden Extremwerte beeinfluBt. 

Was den Maximalwert anbelangt, folgt unsere Behauptung aus der Tat- 
sache, daB die Zyklen von Z, keine O-Kanten enthalten, und deshalb die 
Weglassung der O-Kanten die Elemente von Z, nicht beriihrt. 

Bei der Untersuchung des Minimalwertes ziehen wir in Betracht, dah 
jie positiven Kreise des durch die Weglassung entstehenden Graphen mit 
Jenjenigen positiven Kreisen des urspriinglichen Graphen iibereinstimmen, 
die keine O-Kanten enthalten. Es ist ferner klar, daB die zu den O-Kanten 
pehérigen Multiplizitaten (d.h. die f(x) Werte) einer Kette f den Wert g[/] 
nicht beeinflussen. Nun folgt aus den obigen: Ist f im urspriinglichen Gra- 
phen kreisfiillend, so bleibt diese Eigenschaft auch nach der Weglassung in 
Kraft, und auch g[f] bleibt unverandert. Ist hingegen f im neuen Graphen 
kreisfiillend, so kann man wegen der Endlichkeit des Graphen die O-Kanten 
mit so groBen f Werten versehen, daB f auch im urspriinglichen Graphen 
kreisfiillend wird; dabei bleibt g[/] unverandert. 

Aus den vorgefiihrten Betrachtungen folgt die zu beweisende Behauptung. 


(2. 3.2) Wegen der Annahme g 20 ist der Zyklus z—O ein Element 
yon Z,. Aus der Endlichkeit von © und der Ganzwertigkeit der Ketten folgt 
die Endlichkeit von Z,. Es existiert daher der Wert max y[z]. 

zEZy 


Es sei Z ein — im Abschnitt 2.3 festgehaltenes — Element von Z,, 
fiir welches y[z] = max y[z] gilt. 
zEZyq 


Zum Beweis des Satzes (2.1.6) geniigt es wegen (2. 1. 4) zu zeigen, daB 
sine solche positive, kreisfiillende Kette f existiert, fiir welche g[/]— w[Z] 
besteht. Die Existenz einer solchen Kette beweisen wir in mehreren Schritten. 
Wir setzen im folgenden voraus, daf g > 0 ist. , 


(2. 3. 3) Es existiert eine auf @® definierte ganzwertige Funktion s(X), 
welche die folgende Eigenschaft besitzt: Fiir eine jede Kante x =x(X’'X’’). gilt 


a) w(x) = s(X")—s(X’), falls 0=2(x) < g(x), 
2) W(x) = s(X”)—s(X’), falls 0< 2(x) < (x), 
3) p(x) = s(X”)—s(X), falls 0 < 2(x)=¢(x) 
ist. ‘ 


11 Acta Mathematica IX/3—4 
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Bewels. Wir konstruieren aus J” einen neuen Graphen J”: Die Punkte 
yon I’ seien identisch mit den Punkten von I. Ist x = x(X’X”) eine Grund- 
kante von J’, und ist 
(1’) 2(x)=0, so sei x mit unverandertem y-Wert auch eine Kante von I’; 
(2') 0< z(x) < g(x), so sei x mit unverdndertem w-Wert auch eine Kante 

von J”, auBerdem nehmen wir jedoch noch eine neue Grundkante 

X= xX(X" X’) mit w(x) = — p(x) auf; 

(3’) 0 < Z(x) = ¢(x), so lassen wir die Kante x weg und wir nehmen die 
neue Kante x =x(X”.X’) mit w(x) = — w(x) auf. 

Wir werden die in den Fallen (2') und (3’) auftretenden Kanten x und 
X als zueinander gehdrige Kanten bezeichnen. 

Nun zeigen wir, da fiir jeden positiven Kreis &’ von J” die Unglei- 
chung w[k’] =0 gilt. 

Unsere Behauptung ist trivial fiir k’ —O und fir diejenigen Kreise, die 
aus zwei zusammengehdrigen Kanten x und x bestehen. Ist k von diesen 
verschieden und enthalt es eine neue Kante x, so kann es die zu X gehdrige 
alte Kante x nicht enthalten. Ersetzen wir in k’ eine jede solche Kante x durch 
die Kante —x, wo immer x und X zusammengehdrige Kanten bezeichnen, so 
bekommen wir einen eventuell nicht positiven Kreis k, des Graphen I. Es 
gilt y[k,]—y[k’]. Enthalt k’ keine neue Kante, so sei k,—k’...Die Kette 
2:= 2+, ist ein Zyklus von I. Es gilt z, = 0.:Es ist namlich Z ganzwertig 
und z=0. Ferner ist |k,| = 1 und &,(x)<0O kann nur fiir solche Kanten x 
bestehen, zu welchen wir neue Kanten zugeordnet haben, also fiir welche 
2(x)>0 gilt. Es besteht weiter z,; =, da g und Z ganzwertig sind, |k,|=1 
ist und k,(x)>0 nur fiir solche Kanten x bestehen kann, die auch in k’ ent- 
halten sind, was nur im Falle Z(x) < g(x) méglich ist. Unsere Behauptungen 
bedeuten aber, daB z,€ Z, ist. Demzufolge gilt w[z]+ y[k,] = y[z,] = v[z], 
woraus w[k’] = »[k,] = 0 folgt. 

Man kann nun auf 7” den Hilfssatz (2.2.1) anwenden. Nach diesem 
existiert eine ganzwertige Funktion s(X) mit der folgenden Eigenschaft: Ist 
x= x(X’X”") eine zu I’ gehdrige alte Kante, so besteht w(x) Ss(X”")—s(X’). 
Ist x= x(X’ X’) eine neue Kante, so _besteht w(x) S s(X’) —s(X”), d. h. 
flr die zu x gehdrige alte Kante x—x(X’X”) gilt w(x) = s(X”)—s(X’). 
Aus der Definition von I” folgt jetzt, daB s(X) den in (2.3.3) gestellten 
Forderungen entspricht. 


(2.3.4) Es sei x—x(X’X”) tine beliebige Kante von 7’, und es sei 
| F(x) = max [0, y(x)—(s(X”) —s(X’))], 

wo s(X) eine den in (2.3.3) gestellten Forderungen entsprechende Funktion 
bezeichnet. Wir zeigen, daB f€ F; und g[ f\=y[Z] gilt. 
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f(x) kann nur nichtnegative, ganze Werte annehmen, sie ist also eine 
positive Kette. Es gilt ferner fiir jede Kante x —x(X’X”) 


(4) f(x) = p(x)—(8(X")— 5(X’)). 
Nach (2. 3.3) (2) und (3) 
(5) gilt f(x) = w(x)—(s(X")—s(X’)), falls z(x)>0_ ist. 


Man sieht auch, daB f(x) >0O nur im Falle z(x)— (x) eintreten kann. Dar- 
aus folgt, daB 


(6) F(x) 9(%) = F(x)2z(~) 
fiir jede Kante x besteht. 

f ist kreisfiillend. Es sei namlich k ein beliebiger positiver Kreis. Falls 
k=0 ist, so gilt |f, k| = w[k] —0. Ist k= 0, so seien x,,..., x, die Kanten 
von k, und es sei x; = xi(X:-1X;) ((=1,..., 2), Xn Xo. Dann ist nach (4) 


k= Dx) = S tye) —1(X)—s(X-) = Sve) = le. 


In gleicher Weise ergibt sich aus (5), daB im Falle kcZ |f,k| =wf[k] 
besteht. 
Um die Gleichung o[f]—wy[zZ] zu beweisen, betrachten wir eine nach 


(1.2.7) existierende Darstellung 2—_>'k; von Z, wo k; ein Kreis und k;cz 
i=l 


ist ((—=1,...,m). Es gelten die Gleichungen |f, k;|=w[k] (i—1,...,m), 
und aus diesen und (6) folgt 


gl= Tio) = Li) —Ts/eo(L«e)— 
=> (SVK) =F hw) = Syed =v. 


Damit haben wir den Beweis des Satzes (2.1.6) beendet. 


2.4. Beweis des Satzes (2.1.7) 


(2.4.1) Z; ist nicht leer. Wahlen wir ndmlich zu jeder Kante x, mit 
g(x) >0, einen x enthaltenden, positiven Kreis k,, so ist z=) 9()k 


ein positiver, kantefiillender Zyklus; dabei bedeutet >'* die Summation nach 


samtlichen Elementen von &%, die positive ¢-Werte besitzen. 

Aus der Annahme, dab die w-Werte der positiven Kreise nicht negativ 
sind, und aus (1. 2.10) folgt y{z] = 0 fur jeden positiven Zyklus z. Daraus 
und aus der Ganzzahligkeit der y-Werte ergibt sich, daB der Wert apo w[z] 
existiert. a4 


i1* 
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Es sei z ein im Abschnitt 2.4 festgehaltenes Element von Z;, fiir wel- 
ches w[Z] = min »[z] gilt. 
zEZp 


Zum Beweis des Satzes (2.1.7) geniigt es, nach (2. 1.5) zu zeigen, 
daB eine positive kreisaufnehmbare Kette f existiert, fiir die ¢[f]—y[z] 
besteht. Die Existenz einer solchen Kette beweisen wir in mehreren Schritten. 


(2.4.2) Es existiert eine auf ® definierte ganzwertige Funktion s(X), 
welche die folgende Eigenschaft besitzt: 


(1) Fiir jede Kante x =x(X'X”) ist w(x) = s(X”)—s(X’). 


(2) Fiir diejenigen Kanten x—=x(X'X"), die der Ungleichung 2(x)> 
> max (0, y(x)) geniigen, gilt w(x) =s(X")—s(X’). 


Beweis. Durch Hinzufiigung neuer Grundkanten konstruieren wir aus 
I einen neuen Graphen I” wie folgt: Geniigt eine Kante x = x(X’X”) von 
I der Ungleichung Zz(x) > max (0, »(x)), so fiigen wir zu x eine neue Grund- 
kante Xx = x(X”" X’) mit w(x) = — w(x) hinzu. 
Durch die in (2.3.3) angewendete SchluBweise kénnen wir zeigen, daB 
fiir jeden positiven Kreis k’ von I” w[k’] = 0 gilt. Nach dem Hilfssatz (2. 2. 2) 
existiert dann eine ganzwertige Funktion s(X) mit der folgenden Eigenschaft: 
Ist x= x(X’ X”) eine beliebige Kante von J’, so gilt w(x) = s(X”)—s(X’). 
Ist x = x(X”" X’) eine neue Kante, so gilt w(x) = s(X’)—s(X”), d. h. fiir die 
zu x gehGrige alte Kante x =x(X’X”) gilt w(x) = s(X”")—s(X’). Aus der 
Definition von I” folgt jetzt, daB s(X) den in (2. 4. 2) gestellten Fordrnitas 
geniigt. 
(2. 4. 3) Wir definieren die Funktion f(x) folgendermafen: 
F(x) = YxX)—(S(X")—s(X)), falls 2(x)= p(x) ist, 
f(x) = 0, falls Z(x)> q(x) ist; 
dabei bedeutet x — x(X’X”) eine beliebige Kante von J’ und s(X) eine den 
in (2.4.2) gestellten Forderungen geniigende Funktion. Wir zeigen, dai 
f¢€F, ist, und dab g[f]— wy (2 gilt. 


f(x) kann nur nichtnegative ganze Werte annehmen, d.h. f ist eine 
positive Kette. Ferner gilt 


(3) fiir jede Kante x = x(X’ X”) die Ungleichung f(xA3=w(x)—(s(X”)—s(X’)); 
(4) ftir diejenigen Kanten x —x(X’X”), die der Ungleichung zZ(x)>0 ge- 
niigen, die Gleichung f(x) = w(x)—(s(X”)—s(X’)). 
Die letzte Behauptung folgt im Falle z(x) = (x) aus der Definition von f, 
im Falle Z(x) > g(x) aus (2. 4. 2), da in diesem Falle Z(x) > max (0, (x)) ist. 
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Laut der Definition von f kann f(x)>0O nur im Falle 2(x)— (x) be- 
stehen und daraus ergibt sich die Gleichung 
(5) fo=fe. 

Ganz 4hnlich wie in (2.3.4) kann man mit Hilfe von (3), (4) und (5) 


zeigen, daB f kreisaufnehmbar ist und daB g[f]—w[2Z] gilt. Damit ist der 
Beweis des Satzes (2.1.7) beendet. 


2.5, Nicht-ganzzahlige Bewertungen 


Man kann die Satze (2.1.6) und (2.1.7) auch auf solche Falle tiber- 
tragen, wo die Funktionen (x), w(x), f(x) und z(x) auch nicht-ganzzahlige 
Werte annehmen. Die Definitionen und Sdtze bleiben — mit eventuellen 
kleineren Anderungen — auch dann in Kraft, wenn wir die Forderung und 
die Behauptung der Ganzzahligkeit weglassen. Es ist zum Beispiel z(x) ein 
Zyklus, wenn fiir jeden Punkt X (z, X= Lz), X)=0 gilt. Ferner ist 


es leicht ersichtlich, daB wir statt der nach "er 2. 7) existierenden Zerlegung 


z= Dk die Existenz einer Darstellung = Dak beweisen kénnen, wo 
A= 0 “und k; ein Kreis mit k;Cz ist (i=1,..., 2). 

Die Existenz der in (2. 1.6) und (2. 1.7) baftielenden Extremwerte kann 
man durch die gewodhnliche SchluBweise der Theorie der reellen Funktionen 
erhalten; man muB nur die Grundkanten des Graphen irgendwie in eine Folge 
X,,-..-,Xn Ordnen, und zu einer jeden Kette f einen Punkt [f(x),...,(x,)} 
eines n-dimensionalen Raumes zuordnen. 

Die Definition der Kette z, in (2.3.3) muB man folgendermaBen aban- 
dern: Es sei ¢ bzw. 6 das Minimum der positiven Werte, welche die Funk- 
tion Z(x) bzw. g(x)—Z(x) annimmt. Ist =O bzw. p—Z=0, so sei C=1 
bzw. d=1. seuss sei e= min (6, d, 1). Es ist dann ¢>0. Wir setzen 

A=zZ a9 ek,. 


Eine ahnliche Anderung muB man in (2. 4. 2) durchfiihren. 

Man kann nun leicht kontrollieren, daB durch die erwahnten Modifizie- 
rungen die- Beweise der Satze (2.1.6) und (2. 1. 7) auch auf gig laa 
Funktionenwerte anwendbar sind. 


2.6. Ubertragung des Satzes (2.1.6) auf unendliche Gries 


(2. 6. 1) SATz.: Betrachten wir auch weiterhin nur endliche Ketten, so gilt 
der Satz (2.1.6) auch beziiglich unendlicher Graphen, vorausgesetzt, dap die 
folgenden Bedingungen bestehen: 
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(1) Die w-Werte der kanteaufnehmbaren positiven Zyklen sind von oben 
beschrankt. 

(2) Die Anzahl der 0-Kanten ist endlich. 

(3) Die w-Werte der positiven Kreise, die O0-Kanten enthalten, sind von oben 
beschrankt. 

Den Beweis erhalten wir durch folgende Modifizierung des Beweises 
von (2. 1. 6). 

(2.6. 2) Es geniigt, uns wieder nur mit dem Fall g>O zu_beschdafti- 
gen. Dies kann man aus den Bedingungen (2) und (3) ebenso einsehen, 
wie das in (2.3.1) geschah. Wir heben hervor, dai zufolge g>O jeder 
positive Kreis kanteaufnehmbar ist. 

Gilt fiir jeden positiven Kreis k w[k] =0, so ist die Kette f—O kreis- 
fiillend, und dann ist die Behauptung unseres Satzes trivial. Wir setzen daher 
im folgenden voraus, daB es einen positiven Kreis mit positivem w-Wert gibt. 

Der Zyklus z=O ist ein Element von Z,; Z, ist also nicht leer. Die 
Existenz des Wertes max w[z]—v ist jetzt eine einfache Folge der Bedin- 


gung (1) und der Ganzwertigkeit der w-Werte. Es gilt « >0, da nach unse- 
ren Voraussetzungen ein Element von Z, mit positivem w-Wert existiert. 

Es sei wieder z ein im Abschnitt 2.6 festgehaltenes Element von Zz, 
fiir welches w[Z]— gilt. Wegen u«>O ist 7-0. Zum Beweis unseres 
Satzes geniigt auch jetzt, die Existenz eines solchen Elementes von F; zu 
zeigen, fiir welches g[f]—y[Z] gilt. Das geschieht in mehreren Schritten. 


(2. 6. 3) Zuerst fiihren wir einige neuen Abktirzungen und Begriffe ein. 

Die zu z gehdrigen Punkte und Kanten wollen wir Z-Punkte bzw. 
2-Kanten nennen. — 

Haben die Punkte X und X’ des Graphen J" die Eigenschaft, dab 
sowohl ein positiver XX’-Weg wie auch ein positiver X’X-Weg existiert, so 
sagen wir, daB X mit X’ (in I’) in Verbindung steht, oder daB X und X’ 
(in I’) miteinander in Verbindung stehen. Es ist klar, daB X mit X, und 
wenn X mit X’, dann auch X’ mit X in Verbindung steht. Aus (1. 2. 10) 
folgt ferner, daB wenn X mit X’ und X’ mit X”, dann auch X mit X” in Ver- 
bindung steht. Wie ersichtlich, stehen zwei beliebige Punkte eines positiven 
Kreises immer. miteinander in Verbindung. Aus (1. 2. 8) folgt, daB die Rand- 
punkte einer jeden z-Kante miteinander in Verbindung stehen. 

Wir definieren die Teilmenge ®, von ® wie folgt: Ein Punkt gehért 
dann und nur dann zu ®,, wenn er mit irgendeinem z-Punkt in Verbindung 
steht. Die Teilmenge #, von & wird folgendermaBen definiert: Eine Kante 
gehért dann und nur dann zu &,, wenn die Randpunkte der Kante zu @®, 
gehéren, und wenn diese Randpunkte miteinander in Verbindung stehen. 
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®, bzw. &, enthalt samtliche Punkte bzw. Kanten von Z. Da z= 0 ist, sind 
®, und &, nicht leer. 


(2.6. 4) Wir werden nachfolgend in (2.6.5) beweisen, daB eine auf 
®, definierte ganzwertige Funktion s(X) existiert, fiir die eine jede Kante 
x= x(X’X”) von #, den in (2.3.3) gestellten Forderungen (1), (2) und (3) 
genigt. Mit einer solchen Funktion s(X) definieren wir die Kette f folgender- 
maBen: 

Ist x€W., so sei f(x) =O. Ist xe BW. und x=—x(X’X”),. so sei 
F(x) = max [0, y(x)—(s(X”)—s (X’))]. 

Da 0 < Z(x)= g(x) nur fiir endlich viele Kanten bestehen kann, ist f 
eine endliche Kette. Ferner ist f offensichtlich eine positive Kette. 

Fiir eine jede Kante x= x(X’X”) der Menge %. gilt f(x) = w(x)— 
—(s(X”)—s(X’)), gehdrt jedoch die Kante auch zu Z, so gilt f(x) = w(x)— 
—(s(X")—s(X’)). 

Wie ersichtlich, besteht yalie Gleichung f(x)g(x)—/f(x)Z(x) fiir jede 
Kante des Graphen. 

f ist kreisfiillend. Enthalt namlich der positive Kreis k keine z-Kante, 
so ist der positive Zyklus z,—zZ-+k wegen g >0O kanteaufnehmbar, d. h. es 
ist z,€ Z,, und daher gilt w[z]+ y[k] = w[z.] = y[Z], also ist w[k] =O und. 
\f, k| = w[k]. Enthalt k eine z-Kante, so gehdrt jeder Punkt bzw. jede Kante 
des Kreises zu ®, bzw. W., und man kann dann die Ungleichung |f, k| = [k] 
genau wie in (2.3.4) beweisen. 

_SchlieBlich kann man die Behauptungen, daB im Falle kczZ die 
Gleichung |f, k| = w[k] gilt, und daB g[f]—»[Z] ist, ebenfalls mit der in 
(2. 3.4) angewendeten SchluBweise beweisen. 


(2.6.5) Zum Beweis des Satzes (2.6.1) blieb es nur zu zeigen, dab 
die in (2.6.4) verwendete Funktion s(X) wirklich existiert. Den Beweis fiih- 
ren wir in mehreren Schritten. 

(1) Wir konstruieren aus J’ mit dem in (2. 3. 3) angewendeten Verfahren 
den Graphen J”. Dann gilt fiir jeden positiven Kreis k’ von I” y[k]=0. 

Wir zeigen erst, daB wenn X, und X, in J, so auch in J” miteinander 
in Verbindung stehen und umgekehrt, dab die Verbindung in J” diejenige 
in I’ nach sich zieht. 

Es sei f ein positiver X,X,-Weg v von I. Wir konstruieren aus f einen 
positiven X,X,-Weg f’ des Graphen J”. Gilt fiir jede Kante x von f Z(x) < (x), 
so ist jede Kante von f auch eine .Kante von J”, und man kann f’ = f 
setzen. Es sei nun x = x(X’X”) eine solche Kante von f, die in J” nicht 
vorkommt, d. h. fiir die 0 < Z(x) = q(x) gilt. x ist eine z-Kante, und so 
existiert nach (1. 2. 8) ein aus lauter Z-Kanten bestehender X” X’-Weg f, in I’. 
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Zu jeder z-Kante gehdrt aber eine neue Kante, und so bilden die zu den 
Kanten von f, gehdrigen neuen Kanten einen positiven X’X”- -Weg von 1”. 
Nimmt man nun zu jeder Kante von -f, die in 7” nicht vorkommt, einen 
solchen positiven Weg von I”, so bilden diese Wege zusammen mit den- 
jenigen Kanten von f, die auch in /” vorkommen, eine Folge von sich einan- 
der anschlieBenden positiven Wegen, die in 7” von X, zu X, fihren. Dann 
existiert aber nach (1.2.10) ein in J” liegender, positiver X,X.-Weg. 

Umgekehrt sei jetzt f ein positiver X,X,-Weg von J”. Wir zeigen, 
daB dann auch in I ein positiver X,X,-Weg existiert. Enthalt f’ keine neue 
Kante, so ist f’ selbst ein positiver Weg von 7. Nehmen wir nun an, daf 
f’ eine neue Kante x —x(X” X’) enthdlt. Die zu x gehdrige alte Kante sei 
x—x(X’X”). Es muB dann x eine z-Kante sein und daraus folgt, daB ein 
positiver X” X’-Weg von J’ existiert. Nimmt man zu jeder neuen Kante von 
f’ einen solchen Weg von I, so bilden diese Wege zusammen mit denjeni- 
gen Kanten von f’, die auch in 7’ vorkommen, eine Folge von sich einander 
anschlieBenden positiven Wegen, die in 7’ von X, zu X, fiihren. Dann exi- 
stiert aber nach (1.2.10) ein in 7” liegender positiver X,X.-Weg. 

Aus der bewiesenen Behauptung folgt, dab die Menge derjenigen Punkte, 
die in £” mit z-Punkten in Verbindung stehen, mit ®. identisch ist. 

(II) Es sei X€ ®, und bezeichnen wir die Menge derjenigen in J” 
liegenden positiven X,X-Wege, wo X, sdmtliche mit X in Verbindung ste- 
henden z-Punkte durchlauft, mit H’(X). Es sind dann die w-Werte der zu 
H’(X) gehérigen Wege von oben beschrankt. 


BEwEIs. Es sei der X,X-Weg f’ ein Element von H’(X) und ff ein 
positiver X.X,-Weg von J”. Die Kette z’—/f’+/f{ ist ein positiver Zyklus 
von J”. Wir betrachten eine Zerlegung z’— > k; von 2’, wo ki ein _positi- 

ieee 
ver Kreis von /” ist ((—=1,...,2). Da die w-Werte der positiven Kreise 


von I” nicht positiv sind, gilt vie — Sule =0. Demzufolge ist y[f]= 


= y[2’]—v[f] = —v[f]. Daraus und aus der Endlichkeit der Anzahl det 
z-Punkte folgt unsere Behauptung. 


(III) Es sei X ein beliebiges Element von ®,. Aus (II) und aus de 
Ganzzahligkeit der w-Werte folgt die Existenz von 


s(X) = max {f1] 


Ganz 4hnlich wie im Beweis des Hilfssatzes (2.2.1) kann man jetzt aus de: 
Tatsache, da samtliche positive Kreise von I” nichtpositive w-Werte besit 
zen, zeigen, da eine jede alte Kante x—x(X’X”), bzw. eine jede neu 
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Kante X=x(X"X’), deren Randpunkte zu @. gehéren und miteinander in 
Verbindung stehen, die Ungleichung 


(x) = s(X")—s(X’) baw. W(%) = s(X’)—s(X”) 


befriedigt. Daraus folgt aber ahnlicherweise wie unter (2. 3. 3), daB s(X) den 
in (2.6.4) gestellten Forderungen geniigt. 


§ 3 
3.1. Neue Fassung der S&tze (2.1.6) und (2. 1. 7) 


(3.1.1) Wir kénnen den Satzen (2. 1.6) und (2. 1.7) eine anschaulichere 
Fassung geben, wenn wir — entsprechend der Darstellung (1.2.7) bzw. 
f=e+++++en (Ss. (1.2.4)) — die Zyklen durch ,,Kreissysteme“, die (kreis- 
fiillenden und .kreisaufnehmbaren) positiven Ketten durch » Kantensysteme“ 
ersetzen. 

‘Das Kreissystem x= (k,,...,kn) bzw. das Kantensystem # = (x,,..., Xn) 
ist eine solche Folge von Kreisen bzw. Grundkanten, wo ein Kreis bzw. 
eine Kante auch mehrmals vorkommen kann. Diejenigen Folgen, die sich nur 
in der Reihenfolge ihrer Elemente unterscheiden, betrachten wir als identisch. 
Es ist vorteilhaft, auch die ,leere Folge“ als System zu betrachten. DaB ein 

System leer ist, werden wir mit x =O bzw. «=O ausdriicken. 


(3. 1.2) Sind alle Kreise eines Kreissystems positiv, so heiBt das System 
positiv. Das System xO nennen wir auch positiv. Ist x—(k,,...,kn), so 
heibt w[x] = > w[k] der w-Wert von x. Ist x0, so sei w[x]—0. (Ein 

i=1 
Kreis ist positiv, wenn jede seiner Kanten positiv ist. Nach (2.1.2) gilt fiir 


eine positive Kante e—x, w[e]— (x), fiir eine negative e——x, wle]= 
—=—vw(x). Der y-Wert eines Kreises ist die Summe der w-Werte seiner 
Kanten.) 


Das Zeichen |x, x| soll die Anzahl derjenigen Kreise der Folge k,,..., ks 
bedeuten, welche die Kante x als Grundkante enthalten (d.h. es besteht 
k(x) = 0). Ist x0, so sei |x,x|—0. 

Das Kreissystem x heift kanteaufnehmbar bzw. kantefiillend, wenn fiir 
jede Kante x |x, x| = g(x) bzw. |x, x| = (x) gilt. : 


(3. 1. 3) Ist ¢=(%,,..., Xn), So heibt gle]= > (x) der g-Wert von ¢. 
Ist «=O, so sei gfe] —0. oy 
Das Zeichen |e, k| soll die Anzahl derjenigen Kanten der Folge x, ..., Xs 
bedeuten, die Grundkanten des Kreises & sind. Ist e=0, so sei |e, k|=—0. 
Das Kantensystem « heift kreisaufnehmbar bzw. kreisfillend, wenn fir 
jeden positiven Kreis k |e, k| = w[k] bzw. |e, 4] = wk] gilt. 
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Mit den oben eingefiihrten Begriffen kénnen wir nun die angekiindigte 
Umformung der Satze (2.1.6) und (2.1.7) in folgender Weise durchfiihren. 
(Der Kiirze wegen werden wir die Existenz der Extremwerte, die in unseren 
Satzen vorkommen, von jetzt an nicht mehr explizit festsetzen, wohl aber 
wollen wir diese immer zu den Behauptungen der Satze stillschweigend 
hinzunehmen.) 


(3.1.4) Satz. Ist I endlich und ist g=0, so ist das Maximum der 
w-Werte der kanteaufnehmbaren positiven Kreissysteme gleich dem Minimum 
der g-Werte der kreisfiillenden Kantensysteme. 


(3. 1.5) Satz. /st I” endlich und gilt fiir jedén positiven Kreis w{k|=0, 
ist ferner jede Kante x mit g(x)>0O in einem positiven Kreis enthalten, so 
ist das Minimum der w-Werte der kantefiillenden Kreissysteme gleich dem 
Maximum der g-Werte der kreisaufnehmbaren Kantensysteme. 


3.2. Verallgemeinerung der Sadtze (3.1.4) und (3.1.5) 


Wir wollen unsere Satze in solcher Richtung verallgemeinern, wo die 
Funktionen g und w auch auf den Punkten des Graphen definiert sind. Wir 
miissen dann die Kantensysteme durch »Punktsysteme* bzw. durch ,,Punkt- 
Kantensysteme* ersetzen. 


(3.2.1) Die Punktsysteme sind aus Punkten in gleicher Weise gebildet, 
wie die Kreis- und Kantensysteme aus Kreisen bzw. aus Kanten (s. (3. 1. 1)). 

Ein Punktsystem zr und ein Kantensystem « bilden zusammen ein 
Punkt-Kantensystem y=(z,8). Wir machen folgende Verabredungen: 
(zt, 0) = 2, (0, «) 8, (0,0) =0. 

Zu den schon friiher eingefiihrten ,Inzidenzgraden“ |f, g|, |x, x| und 
|e, x| nehmen wir noch die folgenden hinzu: 

Ist f eine beliebige Kette, so sei 


I X= LUO =z rel 


Wenn k ein Kreis ist, so ist |k, X| gleich 1 oder 0, je nachdem ob X ein_ 
Punkt von & ist oder nicht. 
Ist_x = (Ki, ..., kn) bzw. x== 0, so sei 


|, X|= D ki, X| ZW Mk =e 
1=1 


|x, X| gibt die Anzahl derjenigen Kreise der Folge k,,...,k, an, die den 
Punkt X enthalten. 
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Ist 7=(X,,..., Xn) ein Punktsystem und k ein Kreis, so sei |z, k| 
die Anzahl derjenigen Punkte der Folge X,,...;X,, die auf k liegen. Ist 
ma =0, so sei |, k|=0. 

Ist y =(z, 8), so sei |y,k|=|2,k|+ |e, k|. |y, k| bedeutet die gemein- 
same Anzahl derjenigen Punkte und Kanten von y, die zu k gehoren. 


(3. 2. 2) Es seien g und w zwei ganzwertige Funktionen, die auf samt- 
lichen Punkten und Kanten des Graphen, d. h. auf der Menge Du & defi- 
niert sind. Sind X,,..., X, und e,,...,e, die Punkte bzw. die Kanten des 
Kreises k, so wollen wir jetzt unter dem w-Wert von k den Wert 


v= 2 w(X)+ > vled 
verstehen. Ist K=O, so sei w[k] —0. 
Fiirx=(k,,..., kn), T=(X,..., Xn) und y = (1, 8) sei [x] => [ki], 
: 3 | 


pial => 9(X) und gly] —9l]+ oleh 


- Fir xO und =O sei y[x]—0 und o[a]—0. 

Wir nennen ein Kreissystem x aufnehmbar bzw. fiillend, wenn fiir. jedes 
X und x |x, X| = (X) und |x, x| = (x) bzw. |x, X|=o(X) und |x, x|= 
= ¢(x) gilt. 

Ein Punkt-Kantensystem y heiBt kreisaufnehmbar bzw. kreisfiillend, wenn 
fiir jeden positiven Kreis k |y, k| = w[k] bzw. |v, k| = w[k] gilt. 

In (3. 2.8) werden wir unter Beniitzung eines Gedankens von FORD 
und FULKERSON aus den Satzen (3.1.4) und (3.1.5) die folgenden Verall- 
gemeinerungen ableiten: 


7 (3. 2.3) Satz. Ist I endlich und gilt fiir jedes X und x » =O, so ist 
das Maximum der w-Werte der aufnehmbaren positiven Kreissysteme gleich 
dem Minimum der 9-Werte der kreisfiillenden Punkt-Kantensysteme. 


(3. 2.4) Satz. Ist I" endlich und gilt fiir jeden positiven Kreis k die 
Ungleichung w[k| = 0, gibt es ferner zu jedem Punkt X bzw. zu jeder Kante 
x mit g(X)>0 bzw. y(x)>0 einen positiven Kreis, der den Punkt bzw. die 
Kante enthdlt, so ist das Minimum der wW-Werte der fiillenden Kreissysteme 
gleich dem Maximum der g-Werte der kreisaufnehmbaren Punkt-Kanten- 
systeme. 

Man kann leicht einsehen: Gilt fir jedes X p(X)=o (d.h. sind 
simtliche p(X) Werte geniigend groB), und fiir jedes X y(X)—O, so erhalt 
man aus (3. 2.3) den Satz (3. 1. 4). Ist fir jedes X p(X)=0O und ¥(X)=0, 
so ergibt (3.2.4) den Satz (3. 1. 5). 
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(3. 2.5) Wegen der Anwendungen haben einige Spezialfalle von (3. 2. 3) 
und (3. 2.4) besondere Bedeutung, und zwar bei (3. 2.3) der Fall, wo fiir 
jedes x (x)= co und fiir jedes X w(X)=0 ist, bei (3. 2.4) der Fall, wo 
fiir jedes x o(x)—O und fiir jedes X y(X)—O0 gilt. Wir wollen einige in 
diesen Fallen auftretende Vereinfachungen hervorheben. 

Die Aussage, daB ein Kreissystem x aufnehmbar bzw. fiillend ist, be- 
deutet jetzt, daB |x, X| = y(X) bzw. |x, X| = (X) fiir jeden Punkt X besteht. 
Wir werden ein solches Kreissystem punktaufnehmbar bzw. punktfiillend 
nennen. 

Der w-Wert eines Kreises ergibt sich als die Summe der w-Werte sei- 
ner Kanten. 

Bei der Aufsuchung des Minimums bzw. des Maximums der g-Werte 
kénnen wir uns auf kantenlose Punkt-Kantensysteme, d. h. einfach nur auf 
Punktsysteme beschranken. Ein Punktsystem 2 ist dann kreisfiillend bzw. 
kreisaufnehmbar, wenn fiir jedes positive k |, k| = w[k] bzw. |, k| = w[k] 

ilt. 

i Wir sehen so, daB in der Tat nur die zu den Punkten gehdrigen g- 
Werte bzw. zu den Kanten gehérigen w-Werte eine Rolle spielen, also wir 
kénnen uns auf solche Funktionen g bzw. w beschrdnken, die nur auf Punk- 
ten bzw. Kanten definiert sind. Mit solchen Funktionen formulieren wir die 
betrachteten Spezialfalle folgendermaBen : 


(3. 2.6) Satz. /st I endlich und ist g=O0, so ist das Maximum der 
ap-Werte der punktaufnehmbaren positiven Kreissysteme gleich dem Minimum 
der »-Werte der kreisfiillenden Punktsysteme. 

(3. 2.7) Satz. /st I’ endlich und gilt w[k| = 0 fiir jeden positiven Kreis 
k, gibt es ferner zu jedem Punkt X mit g(X)>O0 einen positiven Kreis, der 
X enthdlt, so ist das Minimum der w-Werte der punktfiillenden positiven 
Kreissysteme gleich dem Maximum der q-Werte der kreisaufnehmbaren Punkt- 
systeme. 


(3. 2.8) Wir ,beweisen nun die Satze (3.2.3) und (3. 2.4) dadurch, 
daB wir sie auf die Satze (3.1.4) bzw. (3.1.5) zuriickfiihren. Zu diesem 
Zwecke konstruieren wir, nach einem Verfahren von FORD und FULKERSON ~ 
((6], S. 212), aus 7” einen neuen Graphen I’. Die Konstruktion kann man 
kurz folgendermafen beschreiben: Wir zerspalten einen jeden Punkt X von 
I in zwei Punkte X~ und X* und fiigen die in X einlaufenden Kanten zu 
X , die von X auslaufenden zu X*, ferner verbinden wir X~ mit X* durch 
eine neue, aus X~ nach X* laufende Kante yx. 

Aus den Funktionen g und w, die auf den Punkten und Kanten des 
Graphen I” definiert sind, bilden wir zwei neue Funktionen g’ und yw’, die 
nur auf den Kanten von J” definiert sind: 
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Ist x eine auch in I’ vorkommende Kante von I”, so sei g’(x) = (x) 
und Bee tb el Fiir eine neue Kante yx sei (yx) = (X) und (yx) = 

Jeder positive Kreis von 7” enthalt mit einem Punkte X~ (bzw. X*) 
den Punkt X* (bzw. X) und die Kante yx. Dies ermdglicht uns, da& wir 
zwischen den positiven Kreisen und dementsprechend zwischen den positiven 
Kreissystemen der Graphen 7° und J” eine sich natiirlicherweise ergebende 
ein-eindeutige Zuordnung errichten. Es ist leicht ersichtlich, daB bei dieser 
Zuordnung die entsprechenden Kreissysteme gleichzeitig aufnehmbar bzw. 
kanteaufnehmbar, sowie gleichzeitig fiillend bzw. kantefiillend sind; ferner, 
daB die w- bzw. y’-Werte der entsprechenden Kreise einander gleich sind. 

Gleichfalls kann man eine natiirliche Zuordnung zwischen den Punkt- 
Kantensystemen von I’ und den Kantensystemen von J” errichten. Hier sind 
die entsprechenden Systeme gleichzeitig kreisaufnehmbar bzw. kreisfiillend, 
sowie besitzen sie gleiche g- bzw. g’-Werte. 

Laut der obigen kénnen wir nun feststellen: Der auf J’ ausgesprochene 
Satz (3.1.4) bzw. (3.1.5) ergibt den auf J” beziiglichen Satz (3. 2. 3) bzw. 
(3. 2. 4). 


3.3. Beliebige Kreissysteme 


(3.3.1) Man kann einen zu (3.2.3) ahnlichen Satz auf beliebige — 
nicht nur positive Kreise enthaltende — Kreissysteme aussprechen. Wir wol- 
len jedoch hier uns nur mit demjenigen Satz beschaftigen, der dem Spezial- 
fall von (3. 2.6) entspricht. 

Es sei also m bzw. w nur auf allen Punkten bzw. Kanten definiert. 
Wir untersuchen nun solche Punktsysteme 2, die mit jedem — nicht nur 
positiven — Kreis k die Ungleichung |, k| = y[k] erfillen. Wir nennen 
diese Punktsysteme b-kreisfiillend. 

Es besteht nun der folgende Satz: 


(3. 3.2) Satz. Ist I endlich und ist p20, so ist das Maximum der 
~-Werte der punktaufnehmbaren Kreissysteme gleich dem Minimum der 9- 
Werte der b-kreisfiillenden Punktsysteme. 


Bewels. Wir fihren unseren Satz auf (3.2.6) zuriick (s. [1], S. 217 
und [6], S. 211). Durch Hinzunahme von neuen Kanten errichten wir aus I’ 
einen Graphen I” wie folgt: Wir nehmen zu jeder Kante x= x(X' X”) von 
IT eine neue Kante x =x(X”X’) mit »(%)—=— (x) auf. Nennen wir einen 
Kreis, der aus zwei zueinander gehérigen Kanten x und x besteht, einen 
0-Kreis, so hat jeder O-Kreis den y-Wert Null. Lassen wir dann aus einem 
positiven punktaufnehmbaren Kreissystem x’ von I’ die eventuell vorkommen- 
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den 0-Kreise weg, so bilden die zuriickbleibenden Kreise ein positives punkt- 
aufnehmbares Kreissystem von J’, das den gleichen y-Wert besitzt wie x’. 
Demzufolge kénnen wir uns bei der Untersuchung des Maximums der w-Werte 
auf diejenigen positiven Kreissysteme beschranken, die keinen O-Kreis ent- 
halten. 

Wenn man jedoch von den 0-Kreisen absieht, so kann man zwischen 
den positiven Kreisen von I’ und sdmtlichen Kreisen von I” eine sich in 
natiirlicher Weise ergebende ein-eindeutige Zuordnung errichten (man ersetze 
in jedem Kreis von /” eine jede neue Kante X durch —x). Bei dieser Zu- 
ordnung stimmen die Punkte und die y-Werte der entsprechenden Kreise 
iiberein. Durch die Zuordnung der Kreise entsteht eine solche ein-eindeutige 
Abbildung der O-kreislosen, positiven Kreissysteme von /” auf samtliche 
Kreissysteme von I’, wo die entsprechenden Systeme gleichzeitig punktauf- 
nehmbar sind und den gleichen w-Wert besitzen. 

Anderseits kann man leicht einsehen, da wenn ein Punktsystem in J” 
kreisfiillend ist, so es in J” 6-kreisfiillend ist — und umgekehrt. 

Nach den obigen kann man nun feststellen: Der auf 7” ausgespro- 
chene Satz (3. 2.6) ergibt den auf 7” beziiglichen Satz (3. 3. 2). 


BEMERKUNG. Ahnlich wie der Satz (2.1.6) lassen sich auch die Satze 
(3. 2.3) und (3.3.2) auf unendliche Graphen ausdehnen. 


§ 4 


In diesem Paragraphen leiten wir einige Maximum-Minimum Satze tiber 
Weg- und Kantensysteme ab. Wir erhalten diese Satze dadurch, daB wir die 
Satze (3. 2.6) und (3. 2.7) auf spezielle Graphen bzw. Bewertungen anwen- 
den. Entsprechend den Satzen (3.2.6) und (3.2.7) soll immer in § 4 die 
Funktion g nur auf den Punkten, die Funktion w nur auf den Kanten defi- 
niert sein. > 

Wir bemerken, daB unser Verfahren auch auf die Satze (3. 1. 4) und 
(3. 1.5) bzw. (3.2.3) und (3. 2.4) anwendbar ist. 


4. 1. Wegsysteme 


(4.1.1) Es sei ® die Menge der Punkte des gerichteten Graphen 7, 
®, und ®z seien zwei — in § 4 festgehaltene — nichtleere, elementfremde 
Teilmengen von ®. Wir werden die Punkte von ®, bzw. @, a-Punkte bzw. 
8-Punkte nennen. @ sowie o sollen im folgenden einen beliebigen der Buch- 
staben « und @ bezeichnen. Ein Weg heiBt eg-Weg, wenn sein Anfangspunkt 
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ein e-Punkt, sein Endpunkt ein o-Punkt ist, und wenn seine inneren Punkte 
weder @- noch $-Punkte sind. 

: Es sei w ein beliebiger Weg und X ein beliebiger Punkt. Der Wert 
des Zeichens [w, X] soll gleich 1 oder O sein, je nachdem X auf w liegt 
oder nicht. (Der in (3. 2. 1) eingefiihrte Wert |w, X| stimmt auBer den Rand- 
punkten von w mit [w, X] tiberein, in den Randpunkten gilt jedoch 2|w, X| = 
—=[w, X].) ; 

Unter einem Wegsystem w—(w,,..., W,) verstehen wir eine solche Folge 
der @§-Wege w; wo ein Weg auch mehrmals vorkommen kann. Systeme, 
die sich nur in der Reihenfolge ihrer Elemente unterscheiden, werden als 
gleich betrachtet. Die ,leere Folge“ (w—O) sei auch ein Wegsystem. 

Das System @ heiBt positiv, wenn alle seine Wege positiv sind, oder 
wenn w =O ist. 


Es sei [w, X]= Sm, x) bzw. [, x|= 0, wenn w=0 ist. [w, X] 
bedeutet die Anzahl derjenigen Wege der Folge w,,...,w,, die den Punkt 
X enthalten. 

Ist 2 =(Xj,-.., Xm) ein Punktsystem und w ein Weg, so sei [2, w] = 


— >'[w, Xj]. Ist 70, so sei [7, w] =0. [zw] bedeutet die Anzahl der- 
tal 


lenigen Punkte von z, die auf w liegen. 
Ist = (X,...,Xm) und w=(W,,..., Wa), SO Sei 


[71, ] = de w= > Sb. X= Slo, XI 


st ze=0O oder w=0, so sei [z, wae. 
Durch die Vereinigung der Wege der Systeme w,,...,@, entsteht ein 
eues System, das wir mit w—(w,,...,@,) bezeichnen wollen. Es gilt 


w, X]== >) [w:, X] fir jeden beliebigen Punkt X. 
7 t=1 


(4. 1.2) Es seien »(X) und w(x) zwei ganzwertige Funktionen, die auf 
len Punkten bzw. Kanten des Graphen definiert sind. 

Wir nennen das Wegsystem w punktaufnehmbar bzw. punkifiillend, 
venn fiir jedes X [w, X] = y(X) bzw. [w, X]=y(X) besteht. Die Menge 
ler positiven punktaufnehmbaren bzw. punktfiillenden Wegsysteme bezeichnen 
vir mit $2, bzw. 92;. er. 

Der w-Wert des Wegsystems w=(w,,...,Wn), Ww] ist gleich der 
yumme der w-Werte der Wege w;. (Der w-Wert eines Weges ist gleich der 
summe der w-Werte seiner Kanten.) Ist w—O, so sei w[w]=0. Ist w= 


=(@,,...,@m), $0 ist y[a] => vio. 


418 T. GALLAI 


Ein Punktsystem zr heiBt wegaufnehmbar bzw. wegfiillend, wenn fiir jeden 
positiven «B-Weg w die Ungleichung [z, w]=w[w] bzw. [z, wy] z= w[v] gilt. 
Gibt.es keinen positiven @$-Weg, so betrachten wir das Punktsystem 7—0 
als wegfiillend. 

Ist zx wegaufnehmbar bzw. wegfiillend, so kann man leicht einsehen. 
daB fiir jedes positive Wegsystem w [2,0] =w[o] bzw. [z, wo] =y[o] gilt 

Wir bezeichnen die Menge der wegaufnehmbaren bzw. wegfiillenden 
Punktsysteme mit R. bzw. R;. 


4.2. Sitze iiber punktaufnehmbare Wegsysteme 


In diesem Abschnitt spielen folgende Bedingungen eine Rolle: 
(4.2.1) p=0. 


(4. 2.2) (1) Jeder positive Ba-, aa- und £e-Weg besitzt einen nicht- 
positiven w-Wert. 

(2) Jeder positive Kreis besitzt — mit Ausnahme jener Kreise, die gleich- 
zeitig a- und 6-Punkte enthalten — einen nichtpositiven w-Wert. 

Es besteht nun der folgende Satz: 


(4. 2.3) Satz. Ist I endlich und bestehen die Bedingungen (4. 2.1) una 
(4. 2. 2), so gilt 
; max SAE eat g [a]. 
@EQ Rr 
Bewelis. (1) Man kann aus unseren Bedingungen leicht einsehen, daf 
die Werte 4, = max wl{o@] und «,— min [az] existieren. Den Beweis det 
wEN, nERe 


Behauptung u,—«, werden wir durch die Konstruktion eines neuen Graphen 
I’ auf den Satz (3.2.6) zuriickfiihren. 7” entsteht aus J’ dadurch, daB wit 
einen jeden $-Punkt mit einem jeden e-Punkt durch je eine neue, von dem 
6-Punkt’ zu dem a@-Punkt gerichtete Kante verbinden. Ferner soll jede neue 
Kante den w-Wert Null erhalten. 


(If) Wir ordnen zu einem jeden positiven Kreis k von J” ein solches 
positives Wegsystem @, von J” zu, fiir welches mit jedem X die Ungleichun- 
gen [m,, X]=|k, X| und w [a] = w [A], bestehen. 

Enthalt & nicht gleichzeitig @- und $-Punkte, so kann k keine neue 
Kante enthalten, also ist k ein positiver Kreis von I und nach (4. 2.2) (2) 
ist w[k]=0. Wir setzen jetzt w,—O0. 

Nehmen wir nun an, dal k gleichzeitig e- und $-Punkte enthalt. Diese 
Punkte zerlegen den Kreis in sich einander anschliefende positive Wege 
Vi, +++,)Un (N22). Jeder Weg v; ist entweder ein eo-Weg, oder er besteh 
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aus einer einzigen neuen Kante. Nach unseren Annahmen kann also w [vi] >0 
nur dann eintreten, wenn vi ein @$-Weg ist. Gibt es zwischen den »; keinen 


af-Weg, so ist viKd—= > yo] 0 und wir setzen dann o,=0O. Sind 


einige v; @f-Wege, so een wir diese mit een iT bezeichnen. Wir 
setzen jetzt w,—(W,,...,Wm). Es gilt dann 


vlol= > viwl= Svel—vid 


und es ist fiir jedes X [w,, X]S|k, X|, da w; und w; ((-+/) gemeinsame 
Punkte nicht enthalten kénnen. 

(If) Es sei x—(k,,...,k,) ein nichtleeres, positives Kreissystem von 
I’. Wir ordnen zu x das positive Wegsystem w, = (ax,,..., @x;) ZU, WO ox, 
jenes Wegsystem bezeichnet, das laut (II) zu k; gehdrt. Ist x0, so sei 
@,—=0. Mit Hilfe dieser Zuordnung beweisen wir die Ungleichung uw, = uj, 
wo “j= max wy [x] ist, und K, die Menge der positiven, punktaufnehmbaren 


xEK} 
Kreissysteme von J” bezeichnet. Ist namlich x—(k,,...,%,) ein nichtleeres 
positives Kreissystem von J”, so gilt 
(*) v [ox] > Y [on] =D y= v [4], 


und fiir jeden Punkt X besteht 


[>., x] —> [o;, X] ssi X[ =|, .X/. 


Ist weiterhin x€K/, so gilt fiir jedes X |x, X|=q@(X), also gilt [w,, X] =X), 
d. h. w,€2.. Die gleichen Behauptungen treffen auch im Falle =O zu. 
Aus (*) und ,€82, folgt nun w= 47. 

(IV) Wir beweisen, daB w,=ui ist. Zu diesem Zwecke erganzen wir 
einen jeden positiven @@-Weg w von I zu einem positiven Kreis k,. von I”. 
Die Erganzung erfolgt durch Hinzunahme derjenigen neuen Kante, die von 
dem Endpunkt zum Anfangspunkt des Weges w fiihrt. Offenbar gelten die 
Gleichungen w [k,.] = w[w], |kw, X|=[w, X] fiir jedes X. 

Ist w==(W,,..., Wn) ein beliebiges, nichtleeres, positives Wegsystem, 
so sei eee eis fay Ist oO, so sei x,—O. Es bestehen die Glei- 
chungen w[x.]=w[o], |x», X|—[o, X] fiir jedes X. Man sieht, daB aus 
w€§2, die Behauptung x€ Kj, folgt. Aus den obenstehenden folgt nun «4, =y1. 

(III) und (IV) ergeben die Gleichung «= «1. 

(V) Bezeichnen wir mit 7; die Menge der kreisfiillenden Punktsysteme 
von I’. Wir zeigen, da& Z;— R; ist. 
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Ist 7 —=(X,,..., Xn) € R; und ist k ein beliebiger positiver Kreis von I’, 
so gilt mit den Bezeichnungen und nach den Behauptungen von (Il) 


a, k|= Dk, X= Slow, X= ol =v lod =v ll 


Es ist daher w€I/;. 
Ist umgekehrt 2 —(X,,..., X,) € J; und ist w ein beliebiger positiver 
a §-Weg, so gilt mit den Bezeichnungen und nach den Behauptungen von (IV) 


[z, w] = p> [w, X]= = [Aue Xi] =|, kro] = v [hv] = p [w]. 


Es ist daher z€ Ry. 
(Die gleichen Behauptungen treffen auch im Falle r—0O zu.) 
Aus den obigen folgt /7; = R;. 
Nun folgt endlich aus (3. 2.6), #4.—«i und 1/;=R; der Satz (4. 2. 3). 


BEMERKUNG. Durch Hinzunahme der folgenden Bedingungen kann man 
den Satz (4. 2.3) auf unendliche Graphen iibertragen: 


(1) Die y-Werte der positiven, punktaufnehmbaren @$-Wege sind von oben 
beschrankt. 

(2) Die Anzahl der O-Punkte ist endlich. (Ein Punkt heift O-Punkt, wenn 
g (X)=0 gilt.) 

(3) Diew-Werte jener positiven @@-Wege, die O0-Punkte enthalten, sind von 
oben beschrankt. 


(4. 2.4) Im folgenden wenden wir den Satz (4. 2.3) auf einige spezielle 
Graphen bzw. w-Bewertungen an. 

Ein gerichteter Graph hei&t azyxlisch, wenn er auBer dem Kreis k=O 
keinen positiven Kreis enthalt. Es gilt nun der folgende Satz: 


(4.2.5) Satz. Ist FP endlich und azyklisch, treten ferner die a-Punkte 
nur als Anfangspunkte, die 6-Punkte nur. als Endpunkte von Kanten auf, 
so gilt mit jeder beliebigen w-Bewertung 


WEL G 


max w[w]—=min g[z], 
1ERe 


vorausgesetzt, dap y =O ist. 


Der Graph kann namlich keinen positiven @a-,@a- und ¢8-Weg, und 
auber k =O keinen positiven Kreis enthalten. Die Bedingungen (4. 2. 2) sind 
daher erfiillt. 

Ist der Anfangspunkt einer jeden Kante ein @-Punkt und der Endpunkt 
ein @-Punkt, so liegt ein spezieller Fall von (4.2.5) vor. Es ist jetzt IF ein 
paarer Graph ({13], S. 170) und die positiven @S-Wege reduzieren sich auf 
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Kanten, die positiven Wegsysteme auf Kantensysteme. Man kann ferner den 
Satz auch auf ungerichtete Graphen aussprechen. 


(4. 2.6) Betrachten wir einen ungerichteten Graphen und es seien auf 
dessen Punkten bzw. Kanten die ganzwertigen Funktionen g(X) bzw. w(x) 


definiert. Ist e—(x,,...,x,) ei Kantensystem, so sei w[e]— >) w(x). Ist 
‘cay | 


¢€=0, so sei w[e] —0. 

Wir nennen das Kantensystem ¢ 1-aufnehmbar bzw. 1-fiillend, wenn fiir 
jeden Punkt X die Anzahl derjenigen Kanten von «, die zu X inzident sind, 
nicht gréBer bzw. nicht kleiner als g(X) ist. Ferner hei&t das Punktsystem 
ze 1-aufnehmbar bzw. 1-fiillend, wenn fiir jede Kante x die Anzahl derjenigen 
Punkte von :t, die zu x inzident sind, nicht grdéfRer bzw. nicht kleiner als 
w (x) ist. 

Nach (4.2.5) kann man nun folgenden Satz formulieren (s. [6], S. 
214—218): 


(4.2.7) Satz. Bei jedem ungerichteten, endlichen paaren Graphen ist 
das Maximum der w-Werte der 1-aufnehmbaren Kantensysteme gleich dem 
Minimum der g-Werte der 1-fiillenden Punktsysteme, vorausgesetzt, dap 
g=0 gilt. 

Im Falle g=1 ergibt (4. 2.7) den in der Einleitung erwahnten Eger- 
varyschen Satz. 


(4. 2.8) Es seien jetzt der Graph und die Mengen ®, und @, beliebig, 
die Funktion w(x) soll jedoch folgendermafen gewahlit werden: Sind beide 
Randpunkte einer Kante x @-Punkte, oder ist kein Randpunkt von x ein 
a-Punkt, so sei w(x)=0O. Ist nur der Anfangspunkt bzw. der Endpunkt von 
x ein a@-Punkt, so sei w(x)—1 bzw. w(x)=—1. 

Es folgt aus diesen Bedingungen, dafi die w-Werte der positiven «/-, 
Ba-, aa-, ®8-Wege, in dieser Reihenfolge, gleich 1,—1,0,0 sind, und dab 
fiir jeden positiven Kreis k w[k]—0 gilt. Daraus folgt jedoch, daB w(x) den 
Bedingungen (4. 2. 2) geniigt. 

Ist weiterhin w —(w,,..., Wn) ein positives Wegsystem, so gilt w[w] = 


=> w[wjJ=n. we] gibt also die Weganzahl von o an. 
t=) 


Ein Punktsystem zc ist jetzt dann und nur dann wegfiillend, wenn jeder 
positive a@$-Weg -mindestens einen Punkt von z enthalt. Nach (4. 2. 3) gilt 
nun der folgende Satz: , 

(4. 2.9) Satz. Ist der Graph endlich und gilt g 20, so ist das Maximum 
der Weganzahien der punktaufnehmbaren positiven Wegsysteme gleich dem 
Minimum der ¢-Werte der wegfiillenden Punktsysteme. 


Wd 
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Dieser Satz ist im wesentlichen einem Falle des ,max-flow min-cut“ 
Satzes gleich (s. [1], [6]). 

Ist g 1, so ergibt (4.2.9) den ae gerichtete Graphen formulierten 
Mengerschen Satz ([7], S. 188). 


BEMERKUNG. Die in (4.2.9) nicht enthaltenen Falle des ,max-flow 
min-cut“ Satzes ({1], [5], [6], [7]) kann man aus dem Satz (3.2.3) und aus 
den unter (3.3.1) bzw. (4.2.10) erwahnten Satzen herleiten. 


(4.2.10) Von (3.3.2) ausgehend kann man einen dem Satze (4. 2. 3) 
ahnlichen Satz erhalten, in dem die Positivitat der Wege nicht verlangt wird. 
Wir kénnen die in (4.2.8) definierte «-Funktion auch hier anwenden. Auf 
diese Weise kann man zu dem auf ungerichtete Graphen beziiglichen ,max- 
flow min-cut“ Satz und zu dem Mengerschen Satz ({14], S. 222) gelangen. 


4.3. Satze iiber punktfiillende Wegsysteme 


Ahnlich wie den Satz (4.2.3) kann man mit Hilfe von (3.2.7) den 
folgenden Satz beweisen: 


(4.3.1) Satz. Ist I’ endlich und azyklisch, kommen ferner die a-Punkte 
nur als Anfangspunkte, die §8-Punkte nur als Endpunkte von Kanten vor, 
sind schlieflich die w-Werte der positiven «f-Wege nicht negativ, so gilt 
min w[@]—= max ¢ [:7], 

if m7ERy 


o€Q, 


vorausgesetzt, dap §2; nicht leer ist. 
Wir heben zwei Spezialfalle von (4. 3.1) hervor. 


(4.3.2) 7 soll nur @- und ¢-Punkte enthalten. Der Graph ist dann 
paarer und an die Stelle der Wegsysteme treten Kantensysteme. Ahnlich wie 
bei (4.2.5) kann man jetzt wieder den Satz auf ungerichtete Graphen for- 
mulieren (s. (4.2.6) und [6], S. 214—218): 


(4.3.3) Satz. Bei jedem endlichen, ungerichteten paaren Graphen ist — 
das Minimum der w-Werte der 1-fiillenden Kantensysteme gleich dem Maxi- 


mum der g-Werte der \-aufnehmbaren Punktsysteme, vorausgesetzt, dap 
w=0 gilt. 


Daf tiberhaupt ein 1-fiillendes Kantensystem existiert, folgt jetzt aus der 
Annahme (2) des Abschnittes 1. 1. 


Derjenige Fall von (4.3.3), wo p=1 und w—1 ist, stammt’ von 
D. KONIG (miindliche Mitteilung, 1932). 
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(4.3.4) Der Graph soll nur die in (4.3.1) gestellten Bedingungen 
erfiillen. Wir definieren die Funktion w folgendermafen: fiir jede Kante x, 
die von einem «-Punkt auslauft, sei w(x)—1, fiir jede andere Kante x sei 
w(x) =O. Ist jetzt w ein positiver «S-Weg, so gilt w[w]—1 und daher gibt 
ww] die Weganzahl des Systems w an. Ein Punktsystem w ist dann und 
nur dann wegaufnehmbar, wenn jeder positive @$-Weg /Adchstens einen Punkt 
von # enthalt. Nach (4.3.1) gilt nun der folgende Satz: 


(4. 3.5) Satz. Ist I endlich und azyklisch und treten die a-Punkte nur 
als Anfangspunkte, die §-Punkte nur als Endpunkte von Kanten auf, so ist 
das Minimum der Weganzahlen der punktfiillenden positiven Wegsysteme 
gleich dem Maximum der y-Werte der wegaufnehmbaren Punktsysteme, vor- 
ausgesetzt, dap irgendein positives punktfiillendes Wegsystem existiert. 

Ist g=1, so gibt (4.3.5) einen von DiLworRTH stammenden, sich auf 
halbgeordnete Mengen beziehenden Satz fiir endliche Mengen an ({2],S. 161, 1. 1). 


4.4. Weitere Satze iiber ungerichtete Graphen 


(4.4.1) In Abschnitt 4.4 sollen folgende Annahmen gelten: 

I sei ein ungerichteter, endlicher Graph, g(X) und w(x) seien ganz- 
wertige, nichtnegative Funktionen, die auf den Punkten bzw. auf den Kanten 
von J’ definiert sind. Unter Ketten wollen wir nur positive Ketten, d. h. nur 
nichtnegative, ganzwertige Funktionen f(x) verstehen. 


(4.4.2) Wir definieren die Begriffe ,x ist eine Kante von f*, ,die 
Anzahl der Kanten von f“, ,die Anzahl der zu X inzidenten Kanten von /“, 
,ein zu f gehoriger Punkt* wie in (1.2.4), die Zeichen w[f] und |f, X| wie 


a (251) 2) bzw.» (3.2: 1). 
Wir heben hervor, da |f, X| die Aalbe Zahl der zu X inzidenten Kanten 


von f bedeutet. Die volle Anzahl der zu X inzidenten Kanten von f heiBt 

der Grad von X in f. Ist der Grad gerade, so ist |f, X| eine ganze Zahl, ist 

er ungerade, so ist |f, X| eine halbe Zahl. Bezeichnet > die Summation nach 
by xX 


sdmtlichen Punkten des Graphen, so folgt aus 
SAX =D ZLO & Y= DIO(LV’E7 N=LLO, 
da fiir jede beliebige Kette f die Anzahl derjenigen Punkte, die in f einen 
ungeraden Grad besitzen, gerade ist. 
Wir nennen jetzt eine Kette f geschlossen (Zyklus), wenn sie keinen 
Punkt ungeraden Grades (in f) enthalt. 
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Gibt es zu der Kette f eine Folge X)x,X,...Xn-1X.X, (a21) mit 
lauter verschiedenen Punkten, und sind X;-; und X;,; die Randpunkte von 
x; ((=1,...,n), gilt ferner f(x;)=1 ((=1,..., 2) und f(x) =0, wenn x mit 
keiner der x; zusammenfallt, so heiBt f ein Weg. X)x,X,...Xn-1Xn Xn ist 
eine zu f gehdrige Folge, X, und X, sind die Randpunkte von /f. 

Die geschlossene Kette k wollen wir einen Kreis nennen, wenn entweder 
k =0 ist, oder wenn es eine solche Kante x gibt, fiir die f—A—x ein Weg 
ist. Nach dieser Definition ist auch eine solche Kette f(x) ein Kreis, die eine 
Kante x’ mit f(x’)=2 enthalt und fiir die f(x)—O fiir x+ x’ ist. Einen 
solchen Kreis werden wir eine zweifache Kante nennen. 

Dem Satz (1. 2.7) entsprechende folgende Behauptung kann man leicht 
durch Induktion beweisen: 


(4.4.3) jJede geschlossene Kette kann man als Summe von Kreisen 
darstellen. 

Durch eine einfache SchluBweise, die dem Beweis von (1.2.9) ahnlich 
ist, gelangt man aus (4. 4. 3) zum folgenden Satz: 


(4.4.4) Jede ungeschlossene Kette f kann mah als Summe von einer 
geschlossenen Kette und von solchen Wegen, die keine gemeinsame Rand- 
punkte haben, darstellen. Jeder Weg verbindet zwei solche Punkte, die in f 
ungeraden Grad besitzen. 


(4.4.5) Wir nennen die Kette f punktaufnehmbar bzw. punktfiillend, 
wenn fiir jedes X |f, X|=@(X) bzw. |f,X|/=@(X) gilt. Wir bezeichnen 
die Menge der punktaufnehmbaren bzw. punktfiillenden Ketten mit F, bzw. 
F;, die Menge der punktaufnehmbaren bzw. punktfiillenden geschlossenen 
Ketten mit G, bzw. Gy; (G.ac F., G;C F)). 


(4. 4.6) Es gilt 
max w[f] = max w[g]. 
f€Fa 9€Ga 


_ Beweis. Die Existenz der Maximumwerte kann man leicht einsehen, 
und so geniigt es nur zu zeigen, daB es zu jedem f von F, ein g von G, mit. 
vg] = wl] gibt. | 

Es sei f ein beliebiges Element von F,. Ist f geschlossen, so ist unsere 
Behauptung trivial. Ist f nicht geschlossen, so betrachten wir eine dem Satz 


(4. 4.4) entsprechende Darstellung f—g’ + > f, (g’ ist geschlossen, die fi 
i=l 


sind Wege ohne gemeinsame Randpunkte (m = 1)). 
Wir wollen jeden Weg f; durch eine geschlossene Kette g, ersetzen. 
Betrachten wir nun einen Weg f; und es sei X,x,X,...Xn1X,X»y eine zu fi 
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gehérige Folge. Wir konstruieren folgende Summen: 


W, = 2) (83-1) (a—1 5S 2r—1=n), 


8 d 
= 2 v(x») (n—15 2s=n). 
j= 
Die Definition von g; lautet: Ist wy, =, so sei gi(xo;- a 2) sels ovey Sf), 


und fiir jede andere Kante x sei g;(x)=0. Ist y,< wy, so sei FN CALS: 
(j=1,...,5), und fiir jede andere Kante x sei g;(x) =O. 

Wie ersichtlich, ist g; geschlossen und es gilt w[gi] = [fi]. AuBerdem 
besteht |g:, X|—|fi, X| fiir jedes X mit ‘Ausnahme von X, und X, und es 
gelten 

1 


1 
ge Ml Xt, gee Xl =f, Xal t 


Daraus folgt (p(x) ist ganzwertig!), da6 die Kette g—g’ + > g; ein Element 
=1 


von G, ist und w[g] = y[/] gilt. 
Ahnlicherweise kann man auch die folgende Behauptung beweisen: 
(4.4.7) Es gilt 
min y[f] = min y[g]. 
feF, gEG, 


(4.4.8) Wir nennen ein Punktsystem  2-aufnehmbar bzw. 2-fiillend, 
wenn die Aalbe Anzahl der Punkte von , die zu einer jeden Kante x inzi- 
dent sind, nicht gr6éBer bzw. nicht kleiner als w(x) ist. 

Unter Beriicksichtigung der zweifachen Kanten kann man leicht einsehen, 
daB ein Punktsystem ze dann und nur dann 2-aufnehmbar bzw. 2-fiillend ist, 
wenn es _,kreisaufnehmbar* bzw._,kreisfiillend“ ist, d.h. wenn fiir jeden 
beliebigen Kreis k |7, k| = w[k] bzw. |, k| = y[A] gilt, wo |, k| die Anzahl 
der auf k liegenden Punkte von zr bedeutet. 

Bezeichnen wir mit 77, bzw. II; die Menge der 2-aufnehmbaren bzw. 
2-fiillenden Punktsysteme, so kénnen wir den folgenden Satz aussprechen: 


(4.4.9) Es gilt 
max w[g] = min ¢[z]. 
geG, nell, 


BeweEls. Bilden wir aus J” den gerichteten Graphen 7” in solcher Weise, 
daB wir zu einer jeden Kante x von I je eine neue Kante x mit den glei- 
chen Randpunkten hinzunehmen und dann x und x mit entgegengesetzten 
Richtungen versehen (s. [1], S. 217 und [6], S. 211). Es sei w(x)=y(x). 
Man kann in natiirlicher Weise zu jedem Kreis k von I” je einen positiven 
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Kreis kK’ von 7’ mit den gleichen Punkten und mit dem gleichen w-Wert 
zuordnen — und umgekehrt. Mit Hilfe dieser Zuordnungen und (4. 4. 3) kann 
man zu einem jeden Element von G, ein den gleichen y-Wert besitzendes, 
punktaufnehmbares positives Kreissystem von /” konstruieren — und umge- 
kehrt. Man kann ferner leicht nachweisen, daf die Punktsysteme in J’ und 
in I’ gleichzeitig kreisfiillend sind oder nicht. 

Nach den obigen Behauptungen kénnen wir nun feststellen: Der auf is 
angewendete Satz (3.2.6) ergibt den auf 7’ ausgesprochenen Satz (4. 4. 9). 
Ahnlicherweise kann man aus (3.2.7) den folgenden Satz ableiten: 

(4.4.10) Es gilt 


min w[g] == max [zz]. 
geG, nell 


(4.4.11) Wir nennen das Kantensystem ¢—=(X,,..-,Xn) 2-aufnehmbar 
bzw. 2-fiillend, wenn fiir einen jeden Punkt X die Aalbe Zahl der Kanten 
von g, die zu X inzident sind, nicht gréBer bzw. nicht kleiner als p(X) ist. 
Diese Kantensysteme entsprechen offensichtlich den punktaufnehmbaren bzw. 
punktfiillenden Ketten. ; 

Nach (4. 4.6) und (4.4.9) bzw. nach (4.4.7) und (4.4.10) kénnen 


wir dann die folgenden Satze aussprechen: 
(4.4.12) Satz. Das Maximum der w-Werte der 2-aufnehmbaren Kanten- 
systeme ist gleich dem Minimum der g-Werte der 2-fiillenden Punktsysteme. 
(4.4.13) Satz. Das Minimum der w-Werte der 2-fiillenden Kantensy- 
steme ist gleich dem Maximum der g-Werte der 2-aufnehmbaren Punktsysteme. 


BEMERKUNG. Man kann die Satze (4. 4.9) und (4.4.12) bzw. (4. 4.10) 
und (4.4.13) auch aus dem Satz (4.2.7) bzw. (4.3.3) ableiten. 


§5 
Als Anwendung der gewonnenen Maximum-Minimum Satze leiten wir 


in diesem Paragraphen einige Bedingungen fiir die Existenz von speziellen 
Faktoren gerichteter und ungerichteter, endlicher Graphen ab. 


9. 1. 1-Faktoren von gerichteten, endlichen Graphen 


(5.1.1) Es sei I’ ein gerichteter, endlicher Graph, der N Punkte enthiilt. 
Unter einem 1-Faktor von I" verstehen wir ein positives Kreissystem mit 
folgender Eigenschaft: Durch jeden Punkt von 7 geht ein und nur ein Kreis 
des Systems ({16], S. 922). ' 

Die gesamte Anzahl der Kanten, die zu den Kreisen eines 1-Faktors 
gehoren, ist gleich N. 


MAXIMUM-MINIMUM SATZE UBER GRAPHEN 427 


Definieren wir die Funktionen g(X) und w(x) so, daf& fir jeden Punkt 
X bzw. fiir jede Kante x g(X)=1 bzw. w(x)=1 gelte, so ist ein positives 
Kreissystem x dann und nur dann punktaufnehmbar bzw. punktfiillend, wenn 
durch jeden Punkt héchstens bzw. mindestens ein Kreis des Systems geht. 
Ferner gibt der w-Wert des Systems die Summe der Anzahlen der Punkte 
der zu dem System gehérigen Kreise an, da die Anzahl der Punkte eines 
Kreises der Anzahl seiner Kanten gleich ist. Daraus folgt, daB 7’ dann und 
nur dann einen 1-Faktor besitzt, wenn das Maximum der w-Werte der punkt- 
aufnehmbaren positiven Kreissysteme, oder das Minimum der w-Werte der 
punktfiillenden positiven Kreissysteme gleich N ist. Da jetzt g[a] die Zahl 
der Punkte des Punktsystems 2 angibt, kann man nach (3. 2. 6) und (3. 2. 7) 
folgenden — zwei duale Behauptungen enthaltenden — Satz aussprechen: 


(5.1.2) Satz. Ein gerichteter, endlicher Graph mit N Punkten besitzt 
dann und nur dann einen 1-Faktor, wenn es zu einer jeden Folge X,,..., Xn, 
die weniger (bzw. mehr) als N Punkte enthdlt (n =1; derselbe Punkt kann 
in der Folge mehrmals auftreten), einen solchen positiven Kreis gibt, der von 
der Folge weniger (bzw. mehr) Elemente enthdlt, als die Anzahl der Punkte 
des Kreises ausmacht. 


(5.1.3) Aus (5.1.2) beweisen wir folgenden Satz von Ore ((15}, S. 
405, Theorem 2. 3.2): 

Jeder reguldre, gerichtete, endliche Graph besitzt einen \-Faktor. 

Einen gerichteten Graphen nennt man reguldr, wenn fiir jeden Punkt 
die Anzahl der auslaufenden Kanten, sowie die Anzahl der einlaufenden 
Kanten die gleiche Zahl / ist (j = 1). 

Die Kette z,)—1, die jede Kante des Graphen mit der Multiplizitat 1 
enthalt, ist jetzt ein positiver Zyklus. Betrachten wir nun eine Zerlegung von 
z, in positive Kreise ki: 2—=K+-+:+km (m= 1, G0 @=1,."7m))> Es 
gehen dann durch jeden Punkt genau / Kreise von k,,..., kn. Bezeichnet 
y(k;) auch ferner die Anzahl der Kanten bzw. der Punkte von &k; und |z, ki| 
die Anzahl derjenigen Punkte eines Systems m—=(X,,...,X,), die auf ki 
liegen, so bestehen folgende Gleichungen: | 


m 


(*) > | ki|=jn, 2 ki) = iN, 
da jeder Punkt in den linksstehenden Summen genau j-mal vorkommt. 

Gilt daher |, ki|2=v(k) fir i—=1,...,m, 80 folgt aus (*), dab n=N 
‘st. Wenn also n< NN ist, so muB ein Kreis k; existieren, fiir den |, ki| < v (ki) 
gilt. Daraus folgt aber nach (5.1. 2), daB der Graph einen 1-Faktor besitzt- 
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5.2. Q-Faktoren von ungerichteten, endlichen Graphen 


(5.2.1) Es sei I” ein endlicher, ungerichteter Graph, der N Punkte 
besitzt. Unter einem Q-Faktor von I” verstehen wir ein solches Kreissystem 
von I’, bei dem durch jeden Punkt von 7’ ein und nur ein Kreis des Sy- 
stems geht. Dabei wird eine durch eine einzige Kante reprasentierte ,,zweifache 
Kante“ als Kreis betrachtet ({16], S. 930). 

Es sei x ein beliebiger Q-Faktor. Nehmen wir die Kanten derjenigen 
Kreise von x, die mehr als zwei Punkte enthalten, je einmal, und diejenigen 
Kanten, welche die in x vorkommenden zweifachen Kanten reprdsentieren, je 
zweimal in einer Folge an. So erhalten wir ein solches Kantensystem, bei 
dem zu jedem Punkt von J” genau zwei Kanten des Systems inzident sind. 
Umgekehrt kann man jedes solche Kantensystem in der angedeuteten Weise 
aus einem Q-Faktor herleiten. Es ist klar, da& in den erwahnten Kantensy- 
stemen die Anzahl der Kanten gleich JN ist. 

Es seien wieder »(X)=1 und w(x)=1. In diesem Falle ist ein Kan- 
tensystem ¢ dann und nur dann 2-aufnehmbar bzw. 2-fiillend, wenn zu jedem 
Punkt héchstens bzw. mindestens zwei Kanten von « inzident sind. Ferner 
gibt w[s] die Anzahl der Kanten von « an. 

Daraus folgt, daf 7’ dann und nur dann einen Q-Faktor besitzt, wenn 
das Maximum bzw. das Minimum der Kantenanzahl der 2-aufnehmbaren bzw. 
2-fiillenden Kantensysteme gleich N ist. Da g[z] wieder die Anzahl der 
Punkte des Punktsystems z angibt, kann man aus (4.4.12) und (4. 4. 13) 
folgenden, zwei duale Behauptungen enthaltenden, Satz ableiten: 


(5.5.2) Satz. Ein ungerichteter, endlicher Graph mit N Punkten besitzt 
dann und nur dann einen Q-Faktor, wenn zu jeder Folge X,,...,Xn, die 
weniger (bzw. mehr) als N Punkte enthdlt (n= 1; derselbe Punkt kann in der 
Folge mehrmals vorkommen), eine solche Kante existiert, zu der weniger (bzw. 
mehr) als zwei Punkte der Folge inzident sind. 


(5. 2. 3) Wir zeigen, daB aus (5.2.2) ein Tuttescher Satz iiber Q-Fak- 
toren folgt ({16], S. 930): 


Ein endlicher, ungerichteter Graph soll ein Q-Graph heifen, wenn zwei 
Teilmengen ®, und ®, der Punkte von J’ existieren, die folgende Eigen- 
schaften besitzen: 


(1) @, und @®, haben keinen gemeinsamen Punkt. 
(2) @, enthalt mehr Punkte als @,. 


(3) Gehért der eine Randpunkt einer Kante zu @,, so gehort der andere 
pAe erm 
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Nun besagt der Tuttesche Satz: 


Ein endlicher Graph besitzt dann und nur dann einen Q- Faktor, wenn 
er kein Q-Graph ist. 


BEwEIS. Es bezeichne N die Zahl der Punkte des Graphen I. 

(I) Wir nehmen zuerst an, daB ein solches, weniger als N Punkte 
enthaltendes Punktsystem existiert, bei dem jede Kante von J” mindestens zu 
zwei Punkten des Systems inzident ist. Es sei w—(X,,..., X,) ein solches 
System mit minimaler Anzahl von Punkten. 

Es existieren Punkte, die in 2 nicht vorkommen. Bezeichnen wir diese 
mit U,,..., U, (721). Ist der eine der Randpunkte einer Kante ein Punkt U;, 
so mu der andere in zc mindestens zweimal vorkommen. Aus der Minimalei- 
genschaft von n folgt, daB in w kein Punkt mehr als zweimal vorkommen 
kann. Bezeichnen wir dann die in z zweimal vorkommenden Punkte mit 
V,,..., Vs, und die Anzahl derjenigen Punkte, die in z nur einmal vor- 
kommen, mit ¢. So gilt n= 2s+-¢ und wir erhalten aus n< Nundr+s+t=N 
die Ungleichung s<r. Die Mengen ®,—(U,,..., U,) und ®,—(V,,..., Vs) 
gentigen demnach den Bedingungen (1), (2), (3), ’ ist also ein Q-Graph. 

(II) Umgekehrt nehmen wir jetzt an, daB © ein Q-Graph ist und es 
seien ®,—(U,,..., U,) und ®,—(V,,..., Vs) zwei, den Bedingungen (1), 
(2), (3) geniigende Mengen. 

Bezeichnen wir jene Punkte, die weder in ®, noch in ®, vorkommen, 
mit X,,..., X:. Existieren solche Punkte nicht, so sei ft=0. Die Zahl der 
Punkte des Systems 7=—(V,,..., Vs, Vi,..., Vs, Xi,..-, Xi) ist n=2s+t< 
<r+s+t=N. Offensichtlich sind nun zu jeder Kante von /’ mindestens 
zwei Punkte von z inzident. 

Aus (I), (II) und (5. 2.2) folgt der Tuttesche Satz. 


(5.2.4) Man kann 4hnlich wie unter (5.1.3) aus (5. 2.2) den folgenden 
Satz beweisen: 

Jeder endliche, ungerichtete, reguldre Graph besitzt einen Q-Faktor. 

Ein ungerichteter Graph heif&t reguidr, wenn zu jedem seiner Punkte 


gleichviele Kanten inzident sind. 
Wir bemerken noch, daf der letzte Satz auch aus nen bekannten Peter- 


senschen Satz, laut dessen jeder endliche, regulare Graph geraden Grades 
einen Faktor zweiten Grades besitzt, folgt (s. [13], S. 161). 


§ 6 
In diesem Paragraphen wollen wir die Satze (2.1.6) und (2.1.7) mit 
Hilfe des Dualitatssatzes der Theorie der linearen Programmierung ({11], 


S. 58—65) ableiten. 
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(6.1) Wir fiihren zuerst geeignete Bezeichnungen ein. Es seien die 
Punkte bzw. die Grundkanten des gerichteten, endlichen Graphen J” X;,..., Xn 


bzw: - 15 eh oWiresetzen, (475 X= Fay. (Die Gré8en a;; kénnen nur die 


Werte 0, 1, —1 annehmen. Die Matrix [a;;] ist die ,Kante-Punkt* Inzidenz- 
matrix von I”) 

Ist f eine beliebige Kette, so sei f;—f(x:) ((—1,-..,). Wir kénnen 
die Kette f durch den Vektor f—[f,,...,f,] ersetzen. f ist positiv, wenn 
f= O.ist (==), 5 M1). ES. ist 


1] n 
(f, X) => 2 ashi 
und eine Kette z ist dann ein Zyklus, wenn 


2D, Ww2u=0 . (j=1,...,m) 
i=] 


besteht. 
Es seien 9: == ¢(xi), wi = w(x) (i= 1,..., 2). Dann gelten 


pl=Leh, vel=> yz 


Der positive Zyklus z ist kanteaufnehmbar bzw. kantefiillend, wenn z,; = 
bzw. z;= gi (i=1,...,n) besteht. 
Fiir den Inzidenzgrad der positiven Ketten f und z gilt 


n 


hz) > fiz 


==) 
Die positive Kette f ist kreisaufnehmbar bzw. kreisfiillend, wenn fiir 
jeden positiven Zyklus z |f,z| = y[z] bzw. |f,z| = v[z] gilt (s. (2.1. 3)). 


(6.2) Um den Satz (2.1.6) zu behandeln, verzichten wir vorlaufig auf 
die Ganzzahligkeit der vorkommenden Werte. Dann bedeutet die Bestimmung 
der maximalen w-Wert besitzenden, positiven, kanteaufnehmbaren Zyklen die 


Aufsuchung derjenigen Zahlensysteme z,,...,2,, die den linearen Ausdruck 
(1) WZ eee + Wn2n 

maximal. machen, wahrend sie folgende Bedingungen erfiillen : 

(2) 21 Pilsner; Zn =n; 


ay Zit ess + Oni 2,=0, 


(3) : 
AimZ1 + °** + AanZn =O; 
(4) ce. 0; arate 0: 


Dies ist ein lineares Programmierungsproblem mit gemischten Bedingungen. 
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Zu diesem ,urspriinglichen* Problem gehdrt das folgende ,,duale“ 
Problem (s. [11], S. 63): 

Man soll diejenigen Zahlensysteme /f,...,f,,51,...,Sm bestimmen, die 
den linearen Ausdruck 


(5) gifit a} + @itn 
minimal machen, wabrend ‘sie folgende Bedingungen erfiillen: 


Aitau sit ys + Aim Sm = Wi, 


(6) ’ : 
Sr tausi + he + Qin Sm = Wn; 
(7) ie 0, tes in OF 
(Die Erfiillung der Bedingungen s,=0,..., 5, =O wird nicht gefordert !) 

Die in (2.1.6) gestellte Annahme gy =O, d.h. die Annahmen g, = 0, 
-++>Gn =O sichern, daB ein Wertsystem existiert, welches den Bedingungen 
(2), (3), (4) geniigt. (z, =0,...,z, =O ist namlich ein solches System.) 

Die Existenz eines Wertsystems f,,...,f:,5,,-.-,Sm, das den Bedin- 
gungen (6) und (7) geniigt, ist trivial. Nun folgt aus diesen beiden Existen- 
zen nach dem Dualitétssatz (genauer nach dem Existenz- und Dualitatssatz) 
das Vorhandensein eines den Bedingungen (2), (3), (4) geniigenden Wert- 
systems 2;,...,2n, welches (1) maximal macht, sowie das Vorhandensein 
eines den Bedingungen (6), (7) geniigenden Wertsystems f,,..., fr, Si,-+-) Sm) 
welches (5) minimal macht; ferner folgt, daB das Maximum von (1) gleich 
dem Minimum von (5) ist. ({11], S. 60—61.) 

Bei einem bestimmten Wertsystem f,,..., f, hat aber das Ungleichungs- 
system (6), laut eines bekannten Satzes ((4], S. 100), dann und nur dann 
eine Lésung in den Unbekannten s,,...,s,, wenn fiir samtliche die Bedin- 
gungen (3) und (4) erfiillende Wertsysteme z,,..., 2, stets 


2(Yr =) = pad pA: (Wr —hf,) = 0, 


Zfit ++ 2nfn Zz Apit eos +2nWn 

gilt. Das bedeutet jedoch nach (6.1), daB die Kette [f,,...,f.)—/ kreisfiil- 
lend ist. Das duale Problem ist daher gleichwertig mit der Aufsuchung sol- 
cher positiven, kreisfiillenden Ketten f—[f,,...,f,], deren g-Werte minimal 
sind. Abgesehen von den Ganzwertigkeiten ergibt also der Dualitatssatz tat- 
‘sichlich den Satz (2. 1.6). 

Um den vollstandigen, auch die Ganzwertigkeiten beriicksichtigenden 
Satz (2. 1. 6) zu erhalten, ziehen wir in Betracht, daB die Matrix [a;,] die Inzidenz- 
matrix von I’ ist. Man kann nun leicht zeigen, daB die oben vorkommenden 
Programmierungsprobleme, sowie die zu diesen gehdrigen ,,kanonischen“ 
Probleme ({11], S. 54) unimoduldre Matrizen besitzen. (Eine Matrix heiBt uni- 


d. h. 
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modular, wenn sdmtliche aus ihr gebildeten Minordeterminanten nur die 
Werte 0,1 und —1 annehmen kénnen.) Daraus folgt jedoch (s. [12]) fiir 
ganzzahlige Werte von q; und y,, daB solche ganze Zahlen 2,,...,2, bzw. 
iy +++) Fny Siy +++) Sm existieren, die (1) bzw. (5) maximal bzw. minimal machen 
und die gestellten Bedingungen erfiillen. Damit ist der Beweis von (2. 1.6) 
vollendet. 

(6.3) Um den Satz (2.1.7) zu behandeln, verzichten wir wieder erst 
auf die Ganzzahligkeiten. Nach (6.1) bedeutet dann die Bestimmung der den 
minimalen w-Wert besitzenden positiven, kanteftillenden Zyklen die Aufsu- 


chung derjenigen Wertsysteme z,,...,2n, die den Ausdruck 
(8) Wit ters + Wn2n 
minimal machen, wahrend sie folgende Bedingungen erfiillen: 
(9) CMe Di yea oe 
Qu 21+ +++ + Ont 2n—=O, 
(10) 
GimZ1 + +++ + AnmZn = 0; 
(11) Ze) ee eee 
Zu diesem urspriinglichen Programmierungsproblem gehdort das folgende duale 
- Problem: Man suche diejenigen Wertsysteme fi,...,fn,S:,..-,Sm, die den 
Ausdruck 
(12) Pht + Gufn 


maximal machen, wahrend sie folgende Bedingungen errfiillen : 
Sita $1 + +++ + inSn = YW ; 


(13) 3 : 
Sn nr Si e+ + Anam Sm S Wm3 
(14) fete 0. 
(Die Bedingungen s, = 0,..., sn 20 werden nicht gefordert !) 

Aus der in (2.1.7) gestellten Annahme, nach der jede Kante x, die 
einen positiven g-Wert besitzt, in einem positiven Kreis enthalten ist, folgt: 
Es existiert zu jedem solchen Index i, fiir den 9; >0 gilt, ein solches System 
2,+++,2n, Welches (10) und (11) erfiillt und in dem z;>0 ist. Durch lineare 
Kombination solcher Wertsysteme kann man jedoch leicht ein solches System 
2,+++,2n erhalten, das sdmtliche Bedingungen (9), (10), (11) des urspriing- 
lichen Problems erfiillt. 

Hat weiter das Ungleichungssystem 
ai St + o's dinSm = "1 , 


_ (15) : 
Qni S1 + he + Anam Sm = Wm 
eine Lésung in 5s,,..., Sn, SO existiert offensichtlich ein Wertsystem ff, ..., fn, 
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Sty +09 Sus das die Bedingungen (13) und (14) des dualen Problems erfiillt. 
Die Lésbarkeit von (15) ist mit derjenigen Bedingung gleichwertig, daB fiir 
jedes Wertsystem z,,...,z,, welches (10) und (11) erfiillt, 


WZ, 2s + Wn2n =O 

gilt ([4], S. 100). Diese Bedingung ist aber gleichbedeutend mit der in (2. 1. 7) 
gestellten Annahme, daf fiir jeden positiven Kreis k w[k] = 0 ist (s. (2. 4. 1)). 

Da so die in (2.1.7) gestellten Annahmen die Erfiillbarkeit von (9), 
(10) und (11), sowie von (13) und (14) sichern, folgt nach dem Dualitatssatz 
die Existenz solcher Wertsysteme z,,...,2, und f,,...,fn,Si,.-+)Sm, Welche 
die gestellten Bedingungen erfiillen und (8) bzw. (12) minimal bzw. maximal 
machen. Es folgt ferner, daS das Minimum von (8) gleich dem Maximum 
von (12) ist. 

Bei bestimmten Werten von f,,...,f, hat jedoch (13) dann und nur 
dann eine .Lésung in 5s,,...,5m (s. [4], S.100), wenn fiir jedes Wertsystem 
21,+++,2n, Welches (10) und (11) erfiillt, stets 


Alw—fyter+ 2n(W%n—fu) = O, 


ahit Do +2nfn SAWters +2nWn 

gilt, d.h. wenn die Kette [f,,...,f.]—j kreisaufnehmbar ist. Das duale 
Problem ist demnach gleichwertig mit der Aufsuchung derjenigen positiven, 
kreisaufnehmbaren Ketten f—=[f,,...,/,], deren g-Werte maximal sind. Von 
den Ganzwertigkeiten abgesehen ergibt also der Dualitaétssatz tatsachlich den 

esatz (2. 1-7). | ‘: 
Den vollstandigen Satz (2.1.7) kann man in 4hnlicher Weise erhalten, 

wie bei (2. 1. 6). 
Wir bemerken noch, daB man — abgesehen von den Ganzwertigkeiten — 
— auch die Satze (3.2.6) und (3.2.7) aus dem Dualitdtssatz unmittelbar 
herleiten kann. Bei den Beweisen der Ganzwertigkeiten st6St man jedoch 
hier auf Schwierigkeiten. 


(Eingegangen am 1. September 1958.) 


d. h. 
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